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OBJECTIFS PLAN 


U Elements de genetique 
mendelienne 


1.1 La demarche de Gregor Mendel 

1.2 Lemodele3:1 chezl'homme 

1.3 Dominance et recessivite, multiallelisme 

1.4 Alleles letaux 

1.5 Actualitedu concept de gene 

> Reviser les elements de base de I'analyse mendelienne 

> Approfondir la notion de caractere hereditaire 

> Examiner la relation entre genotype et phenotype 

> Reflechir a la notion de gene 


1.1 LA DEMARCHE DE GREGOR MENDEL 

Dans le memoire publie par Gregor Mendel en 1866, on ne trouve 
nulle reference aux genes ou a la genetique, deux mots qui n’appa- 
raissent qu’en 1905. Pas de reference non plus aux chromosomes, qui 
n’ont pas encore ete observes, ni d’ailleurs a l’heredite. Pourtant, 
l’interet fondateur du travail de Gregor Mendel, est d’avoir aborde L etude 
de la variation des caracteres entre parents et descendants, en limitant 
le nombre des caracteres, en choisissant un modele biologique peu 
sensible aux conditions de l’environnement, et surtout en adoptant une 
demarche d’analyse quantitative simple, consistant a compter a chaque 
generation les individus qui presentent le caractere selectionne par 
l’experimentateur. Gregor Mendel mit ainsi en lumiere par ces choix, 
P existence d’une sorte d’algebre capable de predire la distribution des 
caracteristiques d'u n individu en revelant l’existence de causes cachees, 
conservees dans les cellules sexuelles et transmissibles a la generation 
suivante selon une combinatoire statistiquement invariable. 

Redecouvert au debut du xx e siecle apres 40 ans d’oubli, le travail 
de Gregor Mendel suscita immediatement un engouement extraordi- 
naire. La premiere tache fut de tester et de clarifier les trois principes 
ou « lois » de Mendel : la « loi » de dominance (qu’il n’avait pas 





2 


Chapitre 1 • Elements de genetlque mendelienne 


formulee !), la « loi » de disjonction des caracteres et la « loi » de 
segregation independante des caracteres. En raison de nombreuses 
exceptions, la loi de dominance fut tres vite abandonnee, celle de la 
segregation independante contestee (il faut que les caracteres soient 
portes par des chromosomes separes) et celle de disjonction (« loi de 
purete des gametes »), la seule reellement universelle, rencontra 
certaines exceptions. La plupart de celles-ci s’expliquent par des 
mecanismes particuliers n’affectant pas fondamentalement la regie. 
C’est le cas de l’epistasie (voir plus loin) ou alteration de 1’ expression 
d’un gene par un autre gene ; c’est le cas aussi des alleles multiples, 
des « polygenes » (differents genes sont susceptibles de modifier 
l’expression quantitative d’un meme caractere). Tous ces phenomenes 
ont finalement renforce le modele de Mendel, car ils n’affectaient que 
l’expression des genes, non les regies de transmission. 

Le modele 3:1 

Les lignees parentales sont pures. Croises entre eux, les individus de 
chaque lignee transmettent a leurs descendants des caracteres homo- 
genes et exclusifs. Les lignees selectionnees par Gregor Mendel 
different chez les parents pour un seul caractere. II observe et denombre 
les deux phenotypes parentaux sur chaque individu de la descendance 
de premiere generation (LI, filiation de l re generation) obtenue par 
croisement des parents et sur la descendance de deuxieme generation 
(L2) obtenue par croisement des individus LI entre eux (Tableau 1.1). 

Tableau 1 .1 Resultats obtenus par Gregor Mendel dans les croisements 

DE LIGNEES PURES DE POIS DIFFERANT PAR UN CARACTERE. 


Phenotypes parentaux 
en croisement 

Phenotype 

deFI 

Phenotype 
de F2 

Rapport des 

2 phenotypes de F2 

Graines lisses x ridees 

100% lisses 

5 474 lisses 

1 850 ridees 

2,96:1 

Grainesjaunesx vertes 

100 % jaunes 

6 022 jaunes 

2 001 vertes 

3,01:1 

Petales violets xblancs 

1 00 % violets 

705 violets 

224blancs 

3,15:1 

Gousses jaunes x vertes 

1 00 % vertes 

428 vertes 

152 jaunes 

2,82:1 

Fleurs axiales x terminales 

100% axiales 

651 axiales 

207 terminales 

3,14:1 
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Chez les individus FI, l’un des deux phenotypes parentaux est 
dominant et observable, 1’ autre est recessif et cache. Cependant tous 
les individus FI possedent potentiellement la capacite d’engendrer 
les deux phenotypes puisque le phenotype recessif reapparait a la 
generation F2 et represente le quart des « individus » (rapport des 
phenotypes F2 proche de 3:1). Par l’examen des individus de la gene- 
ration F3, obtenue par autofecondation des individus F2, Gregor 
Mendel revele que les individus F2 se distribuent en realite selon un 
rapport genotypique 1:2:1. Autrement dit chaque plante FI possede 
une paire de genes pour un caractere phenotypique : l’un des genes est 
responsable du phenotype dominant, F autre du phenotype recessif. 
Les deux genes se distribuent a la meiose dans les gametes male et 
femelle de sorte que chaque gamete ne possede qu'un des deux genes 
parentaux. Au moment de la reproduction, la formation de F uf par 
la fusion des gametes produit un descendant avec une paire de genes 
reconstitute aleatoirement. 

Un gene peut exister sous differentes formes denommees alleles 
(ou allelomorphes, formes alternatives). Un individu, ne de la fusion 
des gametes (ovule et spermatozoide), recoi t deux lots de genes 
« equivalents » formant un seul ensemble de genes apparies (paires 
de genes). On doit dire en realite paire d’ alleles. En effet, chaque gene 
(nomme par exemple : « G ») se trouve represente chez cet individu 
sous la forme de deux alleles, Fun maternel, l’autre paternel. Les 
alleles ainsi reunis peuvent etre identiques ou differents. Lorsqu’ils 
sont identiques F individu sera dit « homozygote » (GG ou gg) et 
lorsqu’ils different, il sera dit « heterozygote » (Gg). L’un des deux 
alleles du gene peut l’emporter sur F autre dans son expression 
(l’allele G est dit dominant sur l’allele g, dit recessif). On parlera 
d'homozygote dominant (GG) ou d'homozygote recessif (gg) lorsque 
les 2 alleles sont identiques. Chaque individu possede une formule 
genetique appelee genotype qui regroupe 2 alleles parmi tous les 
alleles de ce gene presents dans F espece. On dira par exemple que 
GG et Gg sont deux genotypes distincts, alors que les phenotypes sont 
generalement similaires puisque G domine sur g. Le genotype de tout 
individu possedant deux alleles du gene « G » aura au choix la formule 
GG ou Gg ou gg. On voit ici que gene et allele sont deux termes associes 
dans une relation proche de celle qui reunit par exemple les termes 
genre et espece. Un genre peut avoir de nombreuses especes, et une 
espece appartient a un genre. Un gene peut avoir de nombreux alleles, 
et un allele se rapporte toujours a un gene. A l’echelle moleculaire, 
la comprehension des deux termes s’avere finalement plus simple. 
Puisqu’un gene est une sequence en bases de l’ADN, dotee d’une 
fonction, toute sequence modifiee, meme sur une seule base, alterant 
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ou non la fonction, doit etre consideree comme un allele. Ainsi, pour 
un gene donne, le nombre d’ alleles est theoriquement eleve, mais 
dans la nature, les alleles n’exergant plus la fonction correspondante, 
surtout si elle est vitale, sont en regie generale elimines avec les indi- 
vidus homozygotes qui les portent. Finalement dans une population 
formee de nombreux individus, un gene donne pourra se presenter 
sous la forme de nombreux alleles (cela peut alter jusqu’a plusieurs 
centaines). Mais chez un individu particulier on ne trouvera au mieux 
que 2 types d’ alleles distincts (individu heterozygote) ou meme un 
seul type si F individu est homozygote (les 2 alleles sont identiques). 

Le modele 9:3:3:1 

Les lignees parentales sont pures (homozygotes) et different par deux 
genes controlant deux caracteres separes (4 phenotypes). Comme 
precedemment, on denombre les individus des generations FI obtenus 
par croisement des parents et F2 par autofecondation entre individus 
FI. 

Des calculs effectues pour chacun des couples de caracteres, on peut 
conclure qu’ils sont independants puisque l’un et l’autre repondent au 
modele 3:1. Le rapport 9:3:3:1 n’est finalement que le produit aleatoire 
de deux rapports independants 3:1 (Tableau 1.2). 


Tableau 1 .2 Resultats obtenus par Gregor Mendel dans le croisement 

DE DEUX LIGNEES PURES DE POIS DIFFERANT PAR DEUX CARACTERES. 


Phenotypes 

parentaux 

Phenotype 

deFI 

Phenotype 
de F2 

Rapport des 
phenotypes 
de F2 

Rapport 
des phenotypes 
de F2 pour 
le caractere 
lisse/ride 

Rapport 
des phenotypes 
de F2 pour 
le caractere 
jaune/vert 

Graines 

lisses 

et vertes 

X 

Graines 
ridees 
et jaunes 

100% 
de graines 
lisses 
et jaunes 

315 lisses 
et jaunes 

9 

— (3,18:1) 
133 

115 (2,97:1) 
140 

108 lisses 

et vertes 

3 

101 ridees 
et jaunes 

3 

32 ridees 

et vertes 

1 
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Verification experimental des deux modeles 
par le croisement test 

Verification du modele 3:1 

Le croisement de pois a graines jaunes (JJ) et de pois a graines vertes 
(jf) donne ( Tableau 1.1) une generation FI a phenotype dominant, a 
graines jaunes et de genotype heterozygote (Jf). En croisant un 
hybride FI (Jj) avec une lignee homozygote recessive a graines vertes 
(jj) on peut predire (Fig. 1.1) qu’il y aura autant de graines jaunes que 
de graines vertes dans la descendance. Le croisement test predit done 
un rapport de phenotypes egal a 1 : 1 . 


(Heterozygote FI) 

#/ 

(Homozygote recessif) 

Graines jaunes 

JJ 

Graines vertes 

0 

* 0 

Gametes J j 

/ / 


Genotypes Jj Jj 

a a 

Graines jaunes 

Graines vertes 

0 

0 

(Rapport 1:1) 50% jaunes 

50 % vertes 


Figure 1.1 Croisement d'un pois heterozygote (hybride FI) avec un pois homo- 
zygote recessif. 


Verification du modele 9:3:3:1 

Le croisement de pois a graines lisses et vertes avec des pois a graines 
ridees et jaunes ( Tableau 1.2) donne une generation FI ou toutes les 
graines sont lisses et jaunes, avec un genotype sous-jacent hybride 
RrJj. En croisant un tel individu FI double heterozygote avec une 
lignee double homozygote recessif (Fig. 1.2) on peut predire qu’il y 
aura equiprobabilite de rencontrer les 4 phenotypes (graines jaunes et 
ridees, vertes et ridees, lisses et jaunes et lisses et vertes) dans la 
descendance, soit un rapport 1 : 1 : 1 : 1 . 
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(FI double heterozygote) (FI double homozygote recessif) 
Rr Jj rr jj 

Graines lisses et jaunes Graines ridees et vertes 



X 



Gametes RJ Rj rJ rj 


100 % rj 


Descendance 


(Rapport 1:1 :1 :1) 



Rr Jj Rr jj rr Jj rr jj 

0 0 © 

Graines Graines Graines Graines 
lisses et lisses et ridees et ridees et 
jaunes vertes jaunes vertes 

25 % 25 % 25 % 25 % 



Figure 1.2 Croisement d'un pois, double heterozygote (hybride F1),avec un pois 
double homozygote recessif? 


Le test de croisement s’opere done entre l’heterozygote de la gene- 
ration FI et un homozygote recessif. 11 permet a l’experimentateur 
d’ analyser le genotype sous-jacent a un phenotype dominant puisque 
le parent homozygote recessif n’apporte que les alleles recessifs a 
sa descendance. 11 peut etre applique d’une maniere generale a la 
determination du genotype d’un individu. 

Methode de calcul des rapports genetiques 
dans les hybrides 

Elle est basee sur le produit des rapports et s’ applique aux phenotypes 
comme aux genotypes. 

Diagramme pour le double hybride 

Lorsqu’on ecrit (R-) ou (/-) cela signifie (Fig. 1.3) que 1’ allele dominant 
(R ou J) qui impose le phenotype peut etre indifferemment apparie 
avec un autre allele dominant (RR ou JJ) ou avec un allele recessif (Rr 
ou Jj) sans modification du phenotype. 
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3 : 1 


3:1 


Composition de F2 


Descendance 


Rapport : 


(R ■) (n) 


(J-) Hi) 



( R-J- ) (« -ii) (fr J -) (rr 0) 


0 0 © @> 


Figure 1.3 Produits des rapports genetiques pour un double hybride. 


Generalisation : exemple d'un diagramme pour un triple hybride 

On admet comme precedemment qu’il y a segregation independante 
des trois genes correspondants aux trois couples de caracteres avec 
dominance d'un des deux alleles. A la generation F2, on a la descen- 
dance correspondant au croisement ( AaBbCc x AaBbCc). Le diagramme 
s’ecrit (Fig. 1.4) : 


(A-) (aa) 


/ \ 


(B-) (bb) 



1 


(B -) (bb) 



3 : 1 

3 : 1 

3 : 1 

3 : 1 

( C- ) (cc) 

(C-) (cc) 

(C-) (cc) 

(C- (cc) 

phenotype 1 

(A - B - C -) 

correspondant a 8 genotypes 

phenotype 2 

(A - B - cc) 

correspondant a 4 genotypes 

phenotype 3 

(A-bb C-) 

correspondant a 4 genotypes 

phenotype 4 

(aa B - C -) 

correspondant a 4 genotypes 

phenotype 5 

(A - bb cc) 

correspondant a 2 genotypes 

phenotype 6 

(aa B - cc) 

correspondant a 2 genotypes 

phenotype 7 

(aa bb C-) 

correspondant a 2 genotypes 

phenotype 8 

(aa bb cc) 

correspondant a 1 genotype 


Figure 1.4 Generalisation du calcul des rapports genetiques dans les hybrides. 
Exemple d'un triple hybride. 
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On obtient, en effectuant les produits successifs (suivre les fleches 
de haut en bas), le modele 27:9:9:9:3:3:3:1 qui n’est qu’une variante 
combinee du modele 3:1, avec 8 phenotypes et 27 genotypes (Fig. 1.4). 

Avec l’accroissement de genes apparies participant aux croisements 
hybrides, tout en maintenant le principe de segregation independante, 
le nombre de phenotypes et de genotypes devient rapidement tres 
eleve ( Tableau 1.3). 

Tableau 1.3 Nombre de phenotypes et de genotypes en fonction 
DU NOMBRE de genes apparentes dans les croisements hybrides 


Nombre de genes apparies 

Nombre de phenotypes 

Nombre de genotypes 

1 

2 

3 

2 

4 

9 

3 

8 

27 

4 

16 

81 

- 

- 

- 

n 

2" 

3" 


1.2 LE MODELE 3:1 CHEZ L'HOMME 

De nombreux caracteres phenotypiques determines par des paires 
d’alleles chez l’homme sont transmis suivant les memes principes que 
ceux qui ont ete decouverts par Mendel chez le pois. Mais l’analyse 
genetique chez l’homme doit evidemment respecter les droits de la 
personne humaine ce qui exclue toute experimentation, c’est pour- 
quoi le geneticien examine les populations humaines naturelles afin 
d’y rechercher les caracteres phenotypiques susceptibles d’etre analyses 
a travers plusieurs generations. Les plus remarquables sont les anoma- 
lies recessives qui apparaissent dans la descendance de personnes ne 
presentant pas elles-memes le phenotype anormal. Line fois l’anomalie 
identifiee, sa transmission est reconstitute dans l’arbre genealogique 
de la famille ou elle est apparue en remontant le plus loin possible 
dans le temps. Un exemple bien connu est fourni par une maladie 
humaine bien etudiee et maitrisee : la phenylcetonurie. 

La phenylcetonurie 

La phenylalanine hydroxylase, premiere enzyme de la voie catabolique 
conduisant de la phenylalanine au fumarate et a l’acetoacetate, cata- 
lyse l’hydroxylation de la phenylalanine en tyrosine (Fig. 1.5). Un 
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deficit en cette enzyme, du a un defaut du gene, s’avere responsable 
de la phenylcetonurie, une maladie genetique humaine assez frequente 
(8 cas pour 100 000 naissances). Elle est due au fait qu'une voie 
secondaire du metabolisme de la phenylalanine est activee en raison 
du deficit en phenylalanine hydroxylase. L’acide amine subit une 
transamination et donne le phenylpyruvate (Fig. 1.5), un compose qui 
s’accumule dans le sang et les tissus et passe avec la phenylalanine 
dans 1’ urine, d’ou le nom donne a la maladie. 



Phenylalanine NADH +H + NAD + Tyrosine 


Phenylalanine hydroxylase 


Phenylacetate 



Alanine 


Figure 1.5 Voie normale du catabolisme de la phenylalanine en tyrosine et voie 
secondaire conduisant au phenylacetate en I’absence d'une phenylalanine 
hydroxylase active. 

Le phenylpyruvate peut etre decarboxyle en phenylacetate qui 
donne une odeur caracteristique a l’urine, un signe qui fut jadis utilise 
par les soignants pour detecter la maladie chez le jeune enfant. 
L’ accumulation de la phenylalanine et de ses derives au debut de la 
vie perturbe le transport et la disponibilite des autres acides amines ce 
qui altere le developpement normal du cerveau et provoque un retard 
mental severe. La phenylcetonurie fut parmi les premieres anomalies 
genetiques du metabolisme, decouvertes chez l’homme. Quand elle 
est reconnue suffisamment tot, le retard mental peut etre evite par 
un regime alimentaire strict. La consommation d’ aliments riches en 
proteines est proscrite comme celle, par exemple, d’ aliments edulcores 
par 1’ aspartame qui est un dipeptide contenant de la phenylalanine. 
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Afin de foumir a 1’ enfant un aliment correct, la caseine du lait est hydro- 
lysee en acides amines, et la plus grande partie de la phenylalanine en 
est retiree. Certains biotechnologues envisagent aujourd’hui de creer des 
vaches transgeniques dont les proteines du lait seraient constitutivement 
a faible teneur en cet acide amine. 

Depuis quelques dizaines d’annees, des tests biochimiques (test de 
Guthrie) peu couteux, sont pratiques des la naissance, a partir d’une 
goutte de sang afin de detecter cette maladie, ce qui evite bien des 
soins couteux et beaucoup de detresse. 

Les enfants atteints par cette maladie (phenotype recessif) possedent 
le genotype pp, les autres le genotype PP ou Pp. Generalement cette 
maladie apparait chez des enfants (fille et g argon, il n’y a pas de 
liaison au sexe) de parents sains (Fig. 1.6 et Fig. 1.7). En effet, puisque 
seuls les enfants porteurs d’ alleles recessifs sont atteints, on en deduit 
que les parents sont heterozygotes sains et possedent chacun un allele 
recessif. Les genotypes de l’arbre genealogique familial s’ecrivent 
comme dans la figure 1.6. 

En raison generalement du trap petit nombre d’individus composant 
la famille au regard des croisements experimentaux indispensables 
pour obtenir le rapport genetique mendelien 3:1 caracteristique du 
monohybridisme, il est tres rare que le rapport observe chez Lhomme 
soit correct (dans la figure 1.6, il est de 1:1). Pour connaitre la 
frequence relative des 3 genotypes de cette maladie dans une popula- 
tion humaine en equilibre, il est possible d’utiliser le calcul suivant : 
si la proportion relative des deux alleles P et p est x et y respecti- 
vement, la frequence des 3 genotypes possibles sera de x 2 pour PP, 
2 xy pour Pp et y 2 pour pp. Numeriquement pour une frequence 
d'homozygotes potentiellement malades de v 2 = 1/12 500, soit 8 %, la 
frequence y de V allele recessif p sera environ de 1/1 12, la frequence x 
de L allele dominant P de 111/112 et la frequence des heterozygotes 
Pp de 2xy = 2(1/112) (111/112) = 1/56. Ce qui signifie que les 
porteurs sains (Pp) sont 220 fois plus frequents que les malades poten- 
tiels (homozygotes recessifs, pp), une difference qui ne peut aller 


b) 




Pp Pp 



p- pp pp p- 


Figure 1.6 Descendance de parents sains porteurs heterozygotes d'une anomalie 
genetique. a) Cas general ; b) application a la phenylcetonurie. 
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Figure 1 .7 Symboles utilises dans I'analyse genealogique. 


qu’en augmentant dans les generations successives et qui souligne 
linalement la rarete de l’allele p. A l’inverse, les unions consanguines 
accroissent le risque de naissance d’un enfant malade particulierement 
si les ancetres des parents sont heterozygotes (Fig. 1.8). Cet exemple, 
qui peut etre generalise (la mucoviscidose ou l’albinisme sont deux 
autres exemples bien documentes), illustre pourquoi les mariages entre 
personnes apparentees, cousins par exemple, augmentent la frequence 
des maladies recessives dans les populations humaines. 

Cependant, grace aux progres de la genetique moleculaire et des 
techniques d’identification des genes et de leurs mutations, la prediction 
du risque d’ anomalies genetiques liees notamment aux alleles recessifs 
s’avere de plus en plus precise et precoce. 11 existe chez 1’homme 
egalement des maladies genetiques transmises selon un mode dominant 
(par exemple la choree de Huntington). Dans ces cas, l’allele normal 
est recessif et c’est l’allele anormal, mute, qui est dominant. La maladie 
(ou le desordre genetique) peut alors apparaitre a chaque generation et 
il est de ce fait en theorie possible de prevoir et d’eviter sa transmission. 
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Figure 1.8 Genealogie d'une famille oil deux enfants sont atteints de phenyl- 
cetonurie (homozygotes recessifs pp) a la suite du mariage consanguin entre des 
cousins dont les ascendants sont heterozygotes. 

De tels alleles dominants defectueux peuvent egalement resulter de 
mutations spontanees (par exemple au moment de la formation des 
gametes) ou provoquees par des conditions environnementales parti- 
culieres (par exemple : a la suite d’une irradiation radioactive ou d’une 
exposition a un agent mutagene). La personne concernee peut ne pas en 
subir immediatement les consequences sauf en general si l’evenement 
se produit a un stade embryonnaire precoce. Mais elle peut trans- 
mettre la mutation a sa descendance si sa lignee germinale (gametes) 
est atteinte. 

La perception de I'amertume par I'homme 
et les grands singes 

II est banal de constater de discretes differences morphologiques entre 
deux individus de la meme espece, meme tres proches genetiquement. 
Elies ne peuvent pas etre pour autant attributes a des anomalies gene- 
tiques. Dans l’espece humaine, elles sont a la base des processus de 
reconnaissance entre les individus. Dans toutes les especes, ces 
phenotypes normaux, mais differents, constituent ce que le geneticien 
appelle le polymorphisme. Dans une version simplifiee, les alleles de 
plusieurs genes portes notamment par les chromosomes X et Y sont 
impliques. On parle de dimorphisme entre les individus de sexe male 
ou femelle (dimorphisme sexuel). 

Le polymorphisme peut aussi se presenter sous une forme cachee. 
C’est le cas par exemple dans la capacite des humains et des grands 
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singes a percevoir le gout amer d’une substance chimique de synthese, 
le phenylthiocarbamide (PTC) qui contient le groupe chimique (N-C=S). 
Certains individus pergoivent une amertume tres desagreable, alors 
que d’autres ne pergoivent rien du tout. La region genomique, en cause 
chez Thomme, contient le gene TAS2R38 qui code l’un des multiples 
recepteurs du gout amer. Cinq alleles (haplotypes) resultant de la 
presence de 3 mutations ponctuelles dans la region codante produisent 
differents recepteurs qui expliquent completement la distribution 
bimodale de la sensibilite ou non au PTC. Conduit au sein de diffe- 
rentes families, un test sensoriel montre, sur la base d’une transmission 
de type mendelien, que deux parents sensibles peuvent avoir des 
descendants insensibles (Fig. 1.9). 11 en resulte que T allele principal 
(l’haplotype) de sensibilite est dominant, et ceux de l’insensibilite, 
recessifs. Bien qu’aucun des deux phenotypes n’ait une valeur selective 
clairement identifiee, leur apparition chez Thomme et le chimpanze 
resulterait d’evenements mutationnels totalement independants. 



| | (^) Sensibles (SS ou Ss) 

^ ^ Insensibles (ss) 

Figure 1 .9 Genealogie d'un dimorphisme humain : I'aptitude a percevoir ou non 
I'amertume du phenylthiocarbamide (PTC). 

1.3 DOMINANCE ET RECESSIVITE, MULTIALLELISME 
Aspects generaux 

La notion de dominance d’un allele s’oppose a celle de recessivite. 
Elle resulte directement de l’etat diploide des metazoaires (individus 
pluricellulaires engendres au sein d’une espece par reproduction sexuee). 
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Ces organismes possedent dans chacune des cellules de leur corps une 
copie de chaque chromosome en provenance de l’un et 1’ autre des 
parents. Les deux chromosomes parentaux, dits homologues, portent 
ainsi la meme serie de genes. Pour un gene donne, 1’ allele paternel 
peut differer cependant de l’allele maternel, et inversement. L’un des 
alleles est dit mute, comparativement a l’autre. Si les deux alleles 
portes par un individu sont identiques, le phenotype qu’ils influencent 
sera en general exprime. S’ils sont differents, le phenotype de 1’ indi- 
vidu, dit alors heterozygote, depend de T allele qui est dominant. L’autre 
allele, dit recessif, peut correspondre a un phenotype particulier qui 
ne sera pas exprime. On dit qu’il est reprime. 11 s’agit d’un cas de simple 
dominance. Tout au long de la descendance de 1’ individu heterozygote, 
le trait phenotypique qui depend de T allele dominant sera exprime a 
chaque generation, alors que ce n’est pas le cas pour le trait pheno- 
typique qui depend de T allele recessif. Un descendant ne peut exprimer 
le phenotype « recessif » que, si les deux alleles sont recessifs et 
identiques (etat homozygote). 

La dominance de T allele sera dite incomplete si le phenotype de 
reference, dit de type sauvage (parce que le plus repandu dans la 
population naturelle) depend de la presence des deux alleles, dits aussi 
de type sauvage. La presence d’un seul allele sauvage peut conduire a 
un phenotype intermediate, d’ou le terme de dominance incomplete. 
II arrive parfois que V allele mute, generalement recessif, influence 
cependant l’expression du phenotype dependant de l’autre allele. Cela 
peut se produire par exemple si la proteine produite par T allele mute 
inhibe par competition la proteine produite par T allele sauvage. On 
parle alors de dominance negative. Ce phenomene s’ observe tres 
souvent lorsqu’un phenotype depend d’un complexe proteique fonc- 
tionnel compose de plusieurs sous-unites (enzymes ou recepteurs de 
voies de signalisation, voir ci-dessous) 

Le terme de co-dominance designe la situation ou les deux alleles 
de type sauvage ou non expriment simultanement et avec une « force » 
comparable deux phenotypes distincts (voir egalement ci-dessous). 

Illustration par un exemple simple 

Supposons qu’un allele dit de type sauvage puisse coder au minimum 
la synthese de 1500 molecules d’une enzyme monomerique (c’est-a- 
dire constitute d’une seule chaine polypeptidique) responsable d’un 
trait phenotypique tres majoritaire au sein d’une population etudiee. 
Les deux alleles de ce type coderont ensemble au minimum 
3 000 molecules d’enzymes. Si l’un des deux alleles est porteur d’une 
mutation qui conduit a une enzyme non fonctionnelle, l’autre allele 
peut coder suffisamment de molecules d’enzyme fonctionnelle (1 500) 
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pour que le phenotype sauvage continue a etre pleinement exprime, si 
par exemple seules 1000 molecules d’enzymes sont necessaires pour 
cela. On dira de cet allele de type sauvage qu'il est dominant. II peut 
arriver que l’allele mute soit responsable d’une activite enzymatique 
distincte de celle qui est associee a E allele de type sauvage. En 
presence des deux alleles, un phenotype intermediate peut en resuiter 
qui marquera I 'existence d’une co-dominance des deux alleles. Par 
contre si les deux alleles mutes sont identiques et ne codent pas 
d’enzyme fonctionnelle, le phenotype sauvage ne sera plus exprime. 
Si cette absence d’enzyme n’est pas letale, c’est le phenotype recessif 
qui prevaudra. 

Etudions maintenant le cas d’une enzyme dimerique fonctionnelle, 
constituee de deux sous-unites polypeptidiques identiques. Les deux 
alleles de type sauvage coderont la formation de 1500 molecules 
d’enzyme dimerique et le phenotype correspondant sera comme prece- 
demment de type sauvage. Mais si l’un des deux alleles est mute, 
1’ autre allele de type sauvage ne pourra plus coder que 375 molecules 
d’enzyme dimerique fonctionnelle (une seule configuration parmi les 
4 possibles, 1500:4). Ce niveau d’enzyme peut s’averer insuffisant 
pour que le phenotype sauvage s’exprime pleinement si comme prece- 
demment 1 000 molecules sont necessaires pour cela. On parlera alors 
de dominance incomplete. 

II peut arriver cependant que 1’ allele sauvage produise suffisamment 
de sous-unites de l’enzyme (par exemple 4000) pour que la quantite 
finale de celle-ci, a l’etat dimerique (dans cet exemple 4 000:4, 
soit 1000) soit suffisante pour que le phenotype sauvage s’exprime 
pleinement. 

Supposons pour continuer la demonstration que l’enzyme soit 
tetramerique (constituee de quatre chaines polypeptidiques identiques). 
Les deux alleles sauvages doivent produire chacun au minimum 
2 000 molecules d’enzymes pour qu’au final, 1 000 molecules d’enzyme 
tetramerique puissent se former et produire un phenotype sauvage 
complet dans les conditions definies plus haut. Si comme dans le 
premier cas evoque, chacun des alleles ne produit que 1 500 sous-unites 
enzymatiques, soit 3000 sous-unites au total, seules 750 molecules 
d’enzyme tetramerique fonctionnelle pourront se former et le pheno- 
type correspondant sera de type intermediate. Si l’un des deux alleles 
est porteur d’une mutation conduisant a une sous-unite non fonction- 
nelle, alors seules 1500 sous-unites seront produites par l’allele de 
type sauvage et un seul tetramere fonctionnel, sur les 12 configurations 
possibles, se formera soit 125 tetrameres enzymatiques fonctionnels 
(1 500: 12) ce qui est probablement tres insuffisant pour qu’un pheno- 
type puisse en resulter. On considere dans ce cas que la (les) mutation(s) 
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de 1’ allele inactivant la sous-unite enzymatique sont de type dominant 
negatif. 

Le cas des groupes sanguins ABH 

II arrive frequemment qu’un gene au sein d’une population possede 
un nombre eleve d’alleles differents. Un individu diploide de cette 
population n’est par definition porteur que de deux exemplaires du 
gene, c’est-a-dire deux alleles seulement (identiques ou differents). 
C’est l’examen de differents individus de la meme population qui revele 
en general ce multiallelisme. On dit que la collection des differents 
alleles constitue une serie allelique. Un exemple simple en est donne 
par les alleles des groupes sanguins humains ABH (0). 

Dans le systeme ABH, on connait quatre phenotypes ( Tableau 1.4) 
et trois alleles principaux ( I B , 1 A et i). Chaque etre humain possede 
seulement 1 (en double exemplaire) ou 2 alleles parmi les 3 possibles. 
Les alleles I A et I B determined la synthese a la surface des cellules 
(hematies) d’un antigene unique. L’ allele i correspond a l’absence de 
synthese de l’un des 2 antigenes precedents. Les alleles I A et I B sont 
dominants lorsqu’ils sont associes a i, et codominants dans le geno- 
type I A I B . 


Tableau 1 .4 Groupes sanguins ABH humains. 


Groupe (phenotype) 

Genotype 

H (0, ni A, ni B) 

ii 

A 

l A l A ou l A i 

B 

l B l B ou l B i 

AB 

l A l B 


Le cas du gene de la tyrosinase 

Un autre exemple est fourni par le gene C des mammiferes. II code 
une enzyme, la tyrosinase, qui intervient dans la synthese des 
pigments (melanines) de la robe. Les differents alleles produisent des 
phenotypes variables allant du noir (synthese pleinement active) a 
L absence de pigments (albinisme) en passant par la serie des gris 
(synthese plus ou moins active). Les relations de dominance/recessi- 
vite entre les alleles d’une serie sont parfois complexes, tel allele 
pouvant etre a la fois dominant et recessif suivant V autre allele avec 
lequel il est combine chez un individu diploide. L’ allele le plus 
frequemment rencontre dans une population naturelle sera generalement 
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appele allele de type sauvage. Chez les vegetaux, le multiallelisme est 
parfois impressionnant pouvant aller pour certains genes particuliers, 
jusqu’a plusieurs centaines d’ alleles. 

Denommer les alleles n’est done pas toujours simple, de sorte que 
les symboles employes par les differents laboratoires peuvent varier. 
Des efforts d’ harmonisation de la nomenclature sont cependant accom- 
plis par les differentes communautes scientifiques regroupees dans 
l’etude de quelques organismes modeles. 

1.4 ALLELES LETAUX 

Un exemple de ce type d’ allele a ete analyse par Lucien Cuenot, un 
geneticien framjais du debut du xx e siecle. Des souris a pelage clair 
(jaunatre) naissent parfois de parents a pelage de type sauvage (on parle 
d’un phenotype « agouti » le poil sauvage etant de couleur noire avec 
une bande jaune, due a l’expression transitoire du gene A (pour 
« Agouti »). Croises entre eux, les individus FI a pelage clair donnent 
une descendance composee toujours aux 2/3 d’individus « jaunes » et 
pour 1/3 d’individus de type sauvage, alors que le rapport mendelien 
attendu serait de 1:2:1. 

Lucien Cuenot a propose qu’un allele A Y , responsable de la couleur 
claire (y pour yellow : jaune) soit dominant sur l’allele sauvage A. A 
l’etat homozygote, F allele serait de plus letal (A Y A Y ). Les individus 
de ce type ne seront done pas comptabilises dans la descendance du 
fait de leur mort precoce in utero. Ainsi, dans le croisement des FI 
(AA Y x A Y A) le rapport devient bien 2/3 A Y A (« jaune ») et 1/3 AA 
(« sauvage »), apres elimination des embryons A Y A y , e’est-a-dire le 
rapport observe. De plus, des souris de phenotype sauvage (genotype 
AA) croisees avec des souris de phenotype « jaune » (A Y A ) donneront 
toujours une descendance a 50 % de phenotype sauvage et 50 % de 
phenotype « jaune ». 

On dit d’un gene qui induit des effets distincts (ici pelage clair et 
viabilite) qu’il est pleiotrope. Le gene Agouti murin possede d’autres 
alleles qui confirment ce phenomene. Par exemple, 1’ allele A VY (viable 
et jaune) donne un pelage clair et des souris obeses. II n’a pas encore 
ete possible de decouvrir a l’echelle moleculaire comment la proteine 
Agouti pouvait provoquer ces effets aussi distincts. On doit remarquer 
cependant que les phenotypes peuvent dependre de la concentration 
de la proteine puisque le gene A Y par exemple est letal a l’etat homo- 
zygote (double dose) mais pas a l’etat heterozygote (simple dose). 
Plus recemment on a decouvert que l’expression du gene Agouti est 
controlee par des mecanismes epigenetiques lies a des niveaux varia- 
bles de methylation de certaines regions de l’ADN, regulatrices de la 
transcription du gene (voir chapitre 5). 
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1.5 ACTUALITE DU CONCEPT DE GENE 
Un concept historique 

Dans les annees 1 860, Gregor Mendel suggere pour la premiere fois 
(voir plus haut), l’existence de « facteurs » transmissibles des parents 
a leurs descendants. Bien que le terme meme de gene soit invente plus 
tard, il explique ses resultats en termes d’heredite des caracteres, fait 
l'hypothese de leur assortment independant, distingue les traits domi- 
nants et recessifs, formule l’existence d’heterozygote et d’homozygote, 
avance ce qui ulterieurement sera defini comme le genotype et le 
phenotype. En 1889, le terme de « pangene », abrege vingt ans plus 
tard en « gene », est invente par Hugo de Vries qui, tout en ignorant 
les travaux de Mendel, designe par ce mot la plus petite particule 
correspondant a une caracteristique hereditaire. En 1910, Thomas 
Morgan montre que les genes sont portes par les chromosomes, ou ils 
occupent des positions specifiques ; il cree avec ses eleves la premiere 
carte chromosomique de la drosophile. En 1928, Frederick Griffith 
demontre que les genes peuvent se transmettre : des bacteries patho- 
genes pour la souris, bien que tuees par la chaleur, peuvent transmettre 
une information genetique et transformer d’autres bacteries, vivantes 
mais non pathogenes, au point de les rendre capables de tuer a leur 
tour des souris. En 1944, Oswald Theodore Avery, Colin McLeod et 
Maclyn McCarty montrent que le principe chimique transformant les 
bacteries est T ADN (Acide DesoxyriboNucleique), et non les proteines 
comme cela etait 1’hypothese dominante. 11s etablissent que l’ADN 
est le support de l’heredite. En 1953, en se basant sur les travaux de 
cristallographie de Rosalind Franklin, James D. Watson et Francis 
Crick etablissent la structure en double helice de T ADN. Cette decou- 
verte majeure apporte pour la premiere fois une explication strictement 
physico-chimique a la notion d’ information genetique et a sa trans- 
mission de generation en generation. Dans une phrase devenue celebre, 
les deux auteurs indiquent en effet, a la fin de leur article fondateur : 
« II ne nous a pas echappe que I ’appariement specifique postule suggere 
du meme coup, un possible mecanisme de reproduction du materiel 
genetique. » 11s anticipaient, ce qui fut ulterieurement demontre, que 
chaque brin de l’ADN apres separation, servait de matrice pour la 
synthese d’un brin complementaire, et qu’a partir d’une molecule 
d’ADN on pouvait en obtenir deux, ce qui est la marque meme du 
principe de la reproduction et de la transmission physique, via un 
support materiel, des instructions genetiques caracteristiques de chaque 
etre vivant. 

Pour la plupart des biologistes, la notion de gene, qui etait alors 
consideree comme un concept plutot abstrait, devint du coup une 
realite physique isolable et manipulable. Le gene se definit alors 
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comme une unite chimique hereditaire, codee dans une sequence de 
nucleotides, ces derniers etant eux-memes, organises en de longs brins 
d’ ADN, constitutifs des chromosomes. Un gene ainsi defini, peut adopter 
de multiples formes differentes (les alleles du gene) correspondant a 
differentes sequences nucleotidiques tres proches les unes des autres, 
et done apparentees. Apres avoir ete converties en ARN messagers, 
ces sequences d’ ADN sont a I’origine de la construction des proteines 
correspondantes, dans le respect du principe qu’a un gene correspond 
au moins une proteine. 

Pour de nombreux biologistes, cette vision devenue historique et 
conventionnelle reste acceptable, a quelques details pres. Pour un 
nombre grandissant de geneticiens, il ne s’agit la que d’une approxi- 
mation cachant une realite bien plus complexe. 

Un concept dynamique 

Au cours des demieres decades en effet, des decouvertes sur la maniere 
dont les informations genetiques associees a la sequence de l’ADN 
assurent le fonctionnement des etres vivants ont revolutionne en la 
complexifiant la vision traditionnelle du concept de gene. Contrairement 
au fonctionnement des genes procaryotes, a l’origine du principe « un 
gene, une proteine », on a decouvert, en premier lieu, que la sequence 
codante des genes eucaryotes est discontinue, en quelque sorte dispersee 
au sein de regions non codantes. Le concept de gene morcele d’une 
part en exons (parties codantes) generalement de petite taille et d’ autre 
part en introns de plus grande taille (parties non codantes) en resulta. 
Pour reconstituer un ARN messager, apte a diriger la synthese des 
proteines, les transcrits primaires d’un tel gene sont episses, grace a 
un mecanisme qui elimine les introns et reconstitue une sequence 
codante continue. Les nombreuses variantes d’un tel mecanisme 
aboutissent a differents ARN messagers alternatifs et finalement a la 
synthese de plusieurs proteines differentes. Contrairement a la vision 
classique un seul gene peut done engendrer plusieurs proteines diffe- 
rentes grace a un epissage altematif (voir le Mini Manuel Biologie 
moleculaire dans cette collection). 

Un degre de complexity supplementaire fut revele avec l’existence 
de genes dont les sequences sont chevauchantes (des exons et introns 
sont communs a plusieurs genes et d’ autres non). Autres elements 
plus recents de complexification, des genes sont places parfois a 
l’interieur d’introns d’autres genes ; des transcrits provenant de 
regions genomiques distinctes se recombinent en une seule molecule 
d’ARN prealablement a leur traduction. Le developpement des 
connaissances portant sur des genomes entiers revele que de tres 
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nombreux transcrits sont synthetises sans qu’ils soient ensuite traduits en 
proteines. II s’agit d’ARN « messagers » non codants. Correspondent- 
ils a des genes au sens traditionnel du mot ? Ces decouvertes attestent 
qu'un grand nombre d’ informations, peut-etre majoritaires, et apparem- 
ment indispensables a la formation et au fonctionnement des etres 
vivants, transitent par des transcrits ARN et non par des proteines 
(Fig. 1.10). Plus etonnant encore, certains ARN associes a des pheno- 
types clairement identifiables, semblent etre transmis de generation 
en generation, independamment des « genes » dont ils sont issus (voir 
chapitre 2, la notion de paramutation). 

Aussi, a la question « Qu’est-ce qu’un gene ? », la reponse a ce 
jour s’avere tres incertaine. On pourrait dire d’une fag on certes un peu 
vague, qu’il s’agit « d’une region definie de la molecule d’ADN, 
correspondant a une unite hereditaire, localisable au sein d’une sequence 
genomique, et qui se trouve associee a des regions regulatrices, des 
regions transcrites et d’autres regions fonctionnelles ». 


Proteine 1 Proteine 2 


Cibles ? Fonctions ? 


t t 


5' UTR 3' UTR 5' UTR 


3' UTR 


\ / 



Figure 1 .1 0 Schema illustrant la complexite d'une region genomique contenant 
des sequences codant des proteines et des sequences produisant des ARN non 
codants. 

Les transcrits derivent de I'un ou I'autre des deux brins d'ADN. lis sont parfois chevau- 
chants ou recombinants. Certains, y compris les transcrits non codants sont alternati- 
vement episses. A la fois les exons et les introns peuvent transmettre des informations 
genetiques. De nombreux microARNs et petits ARN nucleolaires derivent des introns 
chez les animaux. Leurs typologies et leurs fonctions sont encore largement inconnues. 



Points clefs 
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Malgre le flou d’une telle definition, il n’en demeure pas moins que 
le concept (la notion ou l’objet) sous-jacent au terme de « gene » reste 
d’un emploi commode pour designer les entites genetiques transmises 
de generation en generation. 



POINTS CLEFS 


>- L'interet fondateur du travail de G. Mendel, est d'avoir aborde I'etude de la 
variation des caracteres entre parents et descendants, en limitant le nombre 
des caracteres, en choisissant un modele biologique peu sensible aux 
conditions de I'environnement, et surtout en adoptant une demarche 
d'analyse quantitative simple, consistant a compter a chaque generation 
les individus qui presentent le caractere selectionne par I'experimentateur. 

>- Les trois principes ou « lois » de Mendel sont : la « loi » de dominance (qu'il 
n'avait pas formulee !), la « loi » de disjonction des caracteres et la « loi » de 
segregation independante des caracteres. En raison de nombreuses excep- 
tions, la loi de dominance fut tres vite abandonnee, celle de la segregation 
independante contestee (il faut que les caracteres soient portes par des 
chromosomes separes) et celle de disjonction (« loi de purete des gametes »), 
la seule reellement universelle, rencontra certaines exceptions. Le modele 
de Mendel reste une reference, car la plupart des exceptions n'affectent 
que I'expression des genes, non les regies de transmission. 

>- Un gene peut exister sous differentes formes denommees alleles (ou allelo- 
morphes, formes alternatives). Un individu, ne de la fusion des gametes 
(ovule et spermatozoide), regoit deux lots de genes « equivalents » I'un 
maternel, I'autre paternel, formant un seul ensemble de genes apparies 
(paires de genes). 

>- Gene et allele sont deux termes associes dans une relation proche de celle 
qui reunit par exemple les termes genre et espece. Un gene peut avoir de 
nombreux alleles, et un allele se rapporte toujours a un gene. 

>- Dans une population formee de nombreux individus, un gene donne pourra 
se presenter sous la forme de nombreux alleles (cela peut aller jusqu'a 
plusieurs centaines). Mais chez un individu particulier on ne trouvera au 
mieux que 2 alleles distincts (individu heterozygote) ou meme un seul si 
I'individu est homozygote (les 2 alleles sont identiques). 

>- La notion de dominance d'un allele s'oppose a celle de recessivite. Elle 
resulte directement de I'etat diploide des metazoaires (individus pluri- 
cellulaires engendres au sein d'une espece par reproduction sexuee). Ces 
organismes possedent dans chacune des cellules de leur corps une copie 
de chaque chromosome en provenance de I'un et I'autre des parents. 
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> Les relations de dominance/recessivite entre les alleles d'une serie sont 
parfois complexes, tel allele pouvant etre a la fois dominant et recessif 
suivant I'autre allele avec lequel il est combine chez un individu diploide. 
L'allele le plus frequemment rencontre dans une population naturelle sera 
generalement appele allele de type sauvage. 

>- On dit d'un gene qui induit des effets distincts qu'il est pleiotrope. 

>- La structure en double helice de I'ADN est une decouverte majeure qui a 
apporte pour la premiere fois une explication strictement physico-chimique 
a la notion d'information genetique et a sa transmission de generation en 
generation. A partir d'une molecule d'ADN on peut en obtenir deux,ce qui 
est la marque meme du principe de la reproduction et de la transmission 
physique, via un support materiel, des instructions genetiques caracteristiques 
dechaqueetrevivant. 

>- A la question « Qu'est-ce qu'un gene ? », la reponse s'avere encore aujourd'hui 
tres incertaine. On peut avancer qu'il s'agit « d'une region defmie de la 
molecule d'ADN, correspondant a une unite hereditaire, localisable au 
sein d'une sequence genomique, et qui se trouve associee a des regions 
regulatrices, des regions transcrites et d'autres regions fonctionnelles ». 


QCM - QROC 

1.1 Qu ’ appelle-t-on genotype ? 

1.2 Qu ’appelle-t-on phenotype ? 

1 .3 Quelle est la bonne affirmation ? 

a) Un allele est une forme particuliere d’un gene. 

b) Un allele est un gene obligatoirement mute. 

c) Un allele est la forme proteique d’un gene. 

1.4 Quelle est la reponse la plus acceptable a la question « Qu’est-ce 
qu’un gene » ? 

a) Une sequence d’ADN codant une proteine. 

b) Un concept theorique commode sans realite physique. 

c) Une entite chimiquement variable porteuse d’une information trans- 
missible. 

d) Une region definie de la molecule d’ADN, correspondant a une 
unite hereditaire, localisable au sein d’une sequence genomique, et 
qui se trouve associee a des regions regulatrices, des regions transcrites 
et d’autres regions fonctionnelles. 


Reponses 
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1.5 Des jumeaux bivitellins (issus de deux ovules distincts) sont 
engendres par un couple, tous deux heterozygotes (A a) pour L allele a 
recessif de l’albinisme. Quelle est la probabilite pour que les jumeaux 
possedent le meme phenotype de pigmentation (presence ou absence 
de pigmentation) ? 

1.6 Percevoir l’amertume du phenylthiocarbamide (PTC) est une 
caracteristique dominante, non liee au sexe, et son contraire, une 
caracteristique recessive. Une femme qui percoit l’amertume et dont 
le pere ne la percoit pas, epouse un homme ayant un phenotype de 
sensibilite. Ce monsieur a deja eu, dans une union precedente, une 
fille insensible au PTC. a) Quelle est la probabilite que leur premiere 
fille soit insensible ? b) Soit sensible ? c) Leur premier gartjon soit 
sensible ? d) La probabilite que leurs deux premiers enfants, de l’un 
ou 1’ autre sexe, soient sensibles ? 

1.7 Qu’elle est la probabilite pour que le premier enfant d’un couple 
sain soit atteint de phenylcetonurie, sachant que 1’ homme a une soeur 
atteinte et la femme, son frere ? 

1.8 La dystrophie musculaire de Duchenne, une maladie liee a l’X, 
est une grave myopathie qui touche les gargons seulement. Quelle est 
la probabilite, pour qu'une femme dont le frere est atteint ait un enfant 
malade ? 


REPONSES 


1.1 C’est la partie du genome d’un individu qui participe a la deter- 
mination d’une caracteristique specifique, d’un trait phenotypique, de 
1’ individu. 

1.2 Le phenotype d’un organisme fait reference a son apparence 
physique generale et a son organisation mais aussi a 1’ aspect particulier 
d’un trait variable, comme la couleur des yeux, le comportement, ou 
une caracteristique metabolique observable entre les individus d’une 
espece. 

1.3 a) 

1.4 d) 

1.5 La probabilite que se produise l’un ou l’autre de deux evenements 
independants (qui s’excluent mutuellement) est la somme de leurs 
probabilites individuelles. Puisque les genotypes des deux parents est 
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Aa (A, allele sauvage dominant responsable de la pigmentation et a, 
allele recessif de 1’albinisme, absence de pigmentation), la probability 
du phenotype de pigmentation pour les deux jumeaux bivitellins est 
de 3/4 x 3/4 = 9/16, et celui de l’absence de pigmentation (albinisme) 
de 1/4 x 1/4 = 1/16. La probability que se produise l’un ou l’autre sera 
done de : 9/16 + 1/16 = 10/16 soit 5/8. 

1.6 On definit une probability comme le rapport du nombre d’arrivees 
d’un evenement sur le nombre d’occasions qu’il a de se produire 
(nombre d’essais). Si G est l’allele dominant sensible et g, l’allele 
recessif, insensible, les genotypes respectifs du pere et de la mere sont 
Gg. La probability de chaque allele etant de 1/2 et celle du genotype 
insensible gg de 1/4, pour chaque sexe, soit une probability de (1/4 x 1/2) 
= 1/8, pour une premiere Lille insensible. La probability du genotype 
sensible G- est de 3/4, soit pour une fille ou un garden de (3/4 x 1/2) 
= 3/8. La probability que deux evenements independants se produisent 
simultanement est le produit de leurs probabilites respectives. La 
probability que les deux premiers enfants, independamment de leur 
sexe, soient sensibles sera done de 3/4 x 3/4 = 9/16. 

1.7 Comme le caractere est porte par le HSA 12 les deux parents 
peuvent etre porteurs sains ou homozygotes dominants. Au vu de leur 
genealogie, les deux parents doivent etre heterozygotes. La probability 
qu'ils presentent cet etat pour chacun est de 2/3 et la probability qu'ils 
presentent cet etat simultanement est de 2/3 x 2/3 = 4/9. Un quart de 
leurs enfants sera atteint de phenylcetonurie. La probability combinee 
qu’ils soient heterozygotes et que leur premier enfant soit atteint de 
phenylcetonurie est de 4/9 x 1/4 = 4/36 soit 1/9. 

1 .8 Puisque le frere est atteint cela signifie que leur mere qui n’est pas 
malade transmet cependant la maladie et possede le genotype X A X a , 
avec X a designant l’allele defectueux. On suppose que son compagnon 
est sain et possede done le genotype X A Y. La probability de chaque 
allele etant de 1/2, la probability du genotype malade X a Y sera de 1/4, 
et celle qu’un enfant le soit de 1/4 x 1/2 = 1/8. 


OBJECTIFS PLAN 


Mutations et selection 



2.1 Origine des mutations 

2.2 Les differents types de mutations 

2.3 La notion de paramutation 

2.4 Effets des mutations 

2.5 La notion de selection 

2.6 La distinction entre phenotype et genotype 

2.7 Liaison genetique et desequilibre de liaison 

2.8 Heredite et heritabilite 

> Etudier I'origine et le role des mutations 

> Etablir les relations entre mutations et selection 

> Eclairer la notion de desequilibre de liaison 

> Distinguer la part respective des genes et de I'environnement 


2.1 ORIGINE DES MUTATIONS 

Pour survivre et se reproduire, les organismes vivants doivent repliquer 
fidelement leur ADN et le proteger des deteriorations physico-chimiques. 
En effet, des mutations chez I'homme peuvent par exemple deregler le 
controle strict de la division cellulaire, entrainer la proliferation continue 
de certaines cellules et former une tumeur cancereuse. De la meme 
maniere si les mutations concernent l’ADN du spermatozoide ou de 
1’ ovule des parents, des maladies genetiques peuvent en resulter chez 
E enfant. Des mecanismes moleculaires de correction et de reparation 
des defauts de l’ADN minimisent ces risques et agissent a l’instar de 
filtres, certes imparfaits, pour eliminer les dommages causes a V ADN 
par les erreurs de replication ou les agents mutagenes apportes par les 
nuisances environnementales. 
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Etalement de 
10 7 cellules 



Incubation 
pendant 48 h 



16 1 41 9 


Nombre de colonies bacteriennes resistantes 
a I’antibiotique 

Figure 2.1 Mise en evidence des mutations spontanees. 

Les quatre cultures de la meme souche bacterienne sont propagees un grand nombre 
de fois dans un milieu liquide complet puis on realise a partir de chacune de ces quatre 
cultures un etalement d'un nombre identique de bacteries sur milieu complet solide 
en boite de Petri (A) contenant une meme concentration d'un antibiotique puissant. 
Le nombre aleatoire de bacteries mutantes dans chaque culture (B) revele le caractere 
spontane et aleatoire des mutations de I'ADN bacterien conferant une resistance a 
I'antibiotique. Des etalements temoins, non represents ici, realises sur des boites de 
Petri depourvues d'antibiotique donnent pour chacune des cultures apres 48 h d'incu- 
bation un nombre eleve et similaire de colonies. Ceci permet de verifier que le nombre 
de bacteries presentes dans les quatre cultures est bien comparable et qu'aucun 
defaut metabolique dans la croissance des bacteries ne vient perturber I'analyse. 


2.1 • Originedes mutations 
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II faut admettre cependant que si l’ADN etait absolument invariant, 
c’est-a-dire replique avec une fidelite absolue et done depourvu 
totalement de mutations, 1’evolution des especes vivantes a I'origine 
de ce que l’on nomine la biodiversite ne serait pas cette realite admise 
par tous aujourd’hui. Les deteriorations ou les rearrangements de 
sequence de l’ADN d’un individu a un instant donne sont done le 
resultat de la balance qui s’etablit entre les evenements de mutations 
et de rearrangements et l’efficacite des mecanismes de reparation de 
ces alterations. Les taux de mutations varient selon les especes. Dans 
certaines conditions, un taux eleve de mutations peut permettre a 
certains organismes d’evoluer et done de s’adapter plus rapidement a 
leur environnement. Un exemple particulierement eclairant est fourni 
par les mutations bacteriennes entrainant 1’ apparition de resistance 
aux antibiotiques (Fig. 2.1). 

Les mutations liees a des erreurs de duplication de I'ADN 

Les mutations les plus simples portent sur la modification d’une base 
seulement. Ce sont les transitions et les transversions (Fig. 2.2). On 
les nomme aussi mutations ponctuelles. Elies sont a I’origine de la 
notion de polymorphisme d’un seul nucleotide (SNP pour Single 
Nucleotide Polymorphism). A ce type de mutations se rattachent aussi 
les insertions ou les deletions d’un seul nucleotide. Le changement de 
position d’un atome d’hydrogene dans une base (tautomerisation) 
peut conduire egalement a de faux appariements et a des changements 
de base au deuxieme cycle de replication (Fig. 2.3). Les autres modi- 
fications portent sur des fragments d’ADN de taille plus importante. 
Elies sont engendrees generalement par des evenements de recombi- 
naison ou de transposition qui se rangent parfois dans la categorie 
des mutations chromosomiques. 



Transition 



A 

X 

\ 

G 
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purine •« — »- 

pyrimidine -« — »- 

purine 

oyrimidine 



Figure 2.2 Changements de base pyrimidique ou purique par transition ou 
transversion. 
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Les taux de mutations varient enormement d’une espece a une autre. 
Des taux eleves peuvent permettre dans certaines circonstances a un 
organisme de faire face a un changement environnemental rapide 
(Fig. 2.1). 

La frequence des mutations quel que soit leur type varie de 10 -6 a 
10 _n par cycle de replication de l’ADN avec des regions chromoso- 
miques particulierement instables ou la frequence est tres elevee. Elies 
sont nominees pour cela points chauds de mutations. 

II faut ranger dans cette categorie les sequences repetees de deux a 
quatre nucleotides, appelees microsatellites. Ce sont des repetitions 
de bases cytosine et adenine sur un brin d’ADN qui s’ecrivent (CA)„ 
ou en sens inverse sur 1’ autre brin (TG)„. Lors de la replication de ces 
microsatellites, des derapages de la machinerie de duplication se 
produisent frequemment, entrainant des variations dans le nombre n 
de repetitions effectivement copiees. Pour un microsatellite donne, il 
est done frequent d’observer parmi les individus d’une meme espece, 
un fort polymorphisme du nombre de repetitions (e’est-a-dire de la 
taille du microsatellite). Compte tenu du nombre tres eleve (plusieurs 
centaines de milliers) de microsatellites dans le genome des eucaryotes, 
notamment chez rhomme, le choix approprie de certains d’entre eux et 
la combinatoire qui en decoule dans leur polymorphisme de longueur, 
constitue un moyen technique efficace pour caracteriser tout individu de 
l’espece concernee. C’est la technique dite des empreintes genetiques 
largement utilisee dans les demarches d’ identification des personnes 
et de leurs caracteristiques genetiques. 

Sous sa forme ponctuelle, la mutation necessite deux cycles successifs 
de replication pour se fixer. Elle prend son origine dans l’un des 12 appa- 
riements incorrects possibles, lors du premier cycle de replication de 
l’ADN. Elle ne devient effective qu’au deuxieme cycle de replication 
au cours duquel l’appariement incorrect engendre un changement 
definitif dans l’une des molecules-filles d’ADN (Fig. 2.3). 

Les mutations provoquees par des agents mutagenes 

Outre les erreurs spontanees de replication, les mutations sont parfois 
le resultat de deteriorations de l’ADN provoquees par des agents 
mutagenes divers. Les radiations ionisantes et ultraviolettes, certaines 
substances chimiques (agents alkylants, methylants, intercalants) sont 
en cause. 

L’hydrolyse spontanee des groupes NH 2 de la cytosine ou de la 
5-methyl-cytosine donne naissance respectivement a l’uracile et a la 
thymine. Elies s’apparieront alors apres un cycle de replication avec 
L adenine et non plus avec la guanine creant ainsi une mutation 
ponctuelle. 
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5'- AGTCGTTA -3' 
3'- TCAGCAAT -5' 


Reparation 



AGTC C TTA 

TCAGqAAT 


AGTCGTTA 

TCAGCAAT 



2 e cycle de 
replication 



AGTCCTTA 


AGTCGTTA AGTCGTTA AGTCGTTA 


TCAGGAAT 


TCAGCAAT TCAGCAAT TCAGCAAT 


ADN mute 


ADN parental 


Figure 2.3 Deux cycles de replication sont necessaires pour qu'une mutation 
soit definitivement introduite dans une region de I'ADN. 

L' hydrolyse spontanee de la liaison N-glycosidique unissant les 
bases puriques au desoxyribose cree des pseudo-nucleotides sans 
guanine ou adenine, dits apuriniques qui bloquent la replication. 

Le transfert par alkylation de groupes ethyl (comme le A-ethyl-A- 
nitrosouree ou ENU) ou methyl (comme l’ethyl-methanesulfonate ou 
EMS) sur les bases puriques ou pyrimidiques cree souvent des bases 
ethylees ou methylees dont Eappariement naturel est modifie. C’est 
particulierement le cas de la 0 6 -methylguanine qui peut s’apparier 
avec la thymine ce qui provoque a la replication un changement de 
paires G-C en paires A-T. 

Les radicaux libres tels 0 2 ou OH- engendres a partir de l’oxygene 
par les radiations ionisantes ou certains agents chimiques attaquent 
I'ADN et provoquent des adducts transformant les bases ciblees en 
sites hautement mutagenes. 

C’est le cas de la 7,8-dihydro-8-oxoguanine (oxoG) qui peut s’appa- 
rier aussi bien avec la cytosine que l’adenine, provoquant dans ce 
dernier cas une des mutations par transversion les plus frequemment 
rencontrees a l’origine de certains cancers humains. 

La lumiere ultraviolette de longueur d’onde voisine de 260 nm 
(proche UV) est fortement absorbee par les purines et pyrimidines, en 
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raison de leur systeme de doubles liaisons conjuguees. Cela peut provo- 
quer tout particulierement la fusion photochimique de deux thymines 
adjacentes et donner un dimere de thymine (Fig. 2.4) qui ne peut pas 
efficacement s’apparier avec les adenines complementaires ce qui 
bloque 1’ ADN polymerase lors de la replication. 

Les radiations ionisantes (rayons yet rayons X), seules ou associes 
a des agents eux-memes ionisables en especes reactives, provoquent 
des cassures aleatoires de la double helice d’ADN qui conduisent 


swwfwiffifw 
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Figure 2.4 Formation et structure d'un dimere de thymine. 
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souvent a la mort cellulaire. Bien maitrise, leur emploi therapeutique 
sert a limiter la proliferation des cellules tumorales dans le traitement 
de certains cancers. 

Constitues de molecules polycycliques, les agents intercalants 
(ethidium, acridine orange, proflavine) ont des formes aplaties mimant 
les systemes formes par les purines et pyrimidines heterocycliques 
appariees. Ces agents hydrophobes s’intercalent facilement entre les 
plateaux formes par les bases au sein de la double helice. En se gbssant 
entre les plateaux, ils les deforment et favorisent, lors de la replication, 
des insertions ou des deletions de nucleotides. 

Non reparees, toutes ces deteriorations interferent avec la replication 
ou la transcription et mettent en cause la survie cellulaire. II n’est done 
pas etonnant qu’au cours de revolution, des systemes d’identification 
et de reparation de ces dommages aient ete selectionnes. Ils sont bases 
sur des mecanismes d’excision de la base ou du nucleotide defectueux, 
de reparation par recombinaison quand les deux brins de l’ADN sont 
en cause ou dans les cas extremes sur un mecanisme de « passage en 
force » au travers de la lesion. 

La reparation par excision d’une base incorrecte utilise une ADN 
glycosylase qui reconnait et elimine la base indesirable en hydrolysant 
la liaison glycosidique unissant le pentose a la base. La reparation par 
excision d’un nucleotide est basee sur la reconnaissance de la distorsion 
de la double helice occasionnee par le nucleotide incorrect. Lorsque 
la deterioration concerne les deux brins lors d’une cassure complete 
de l’ADN, la reparation ne peut pas s’effectuer en utibsant l’un des 
brins comme matrice modele. Dans ce cas, un ADN homologue est 
utilise comme une matrice modele de secours, a la condition qu’il soit 
effectivement present dans la cellule. 

II arrive que V ADN polymerase rencontre au cours de la replication 
une deterioration non reparee et soit bloquee dans son action de dupli- 
cation. Un mecanisme de fonjage de la lesion peut alors se declencher. 
II est base sur l’action d’ADN polymerases speciales, les ADN poly- 
merases de la famille Y, qui synthetisent l’ADN directement en ignorant 
la lesion, sans le recours a l’appariement conforme a une matrice pour 
incorporer les nucleotides. La consequence inevitable de ce type de 
synthese est l’introduction frequente de nucleotides incorrects. Cela 
assure toutefois la poursuite de la replication, essentielle pour la 
survie de la cellule, meme au prix d’un taux eleve de mutations. 

Contrairement aux idees predominates en vogue apres la decou- 
verte de sa structure, insistant sur le caractere invariant de l’ADN, on 
considere aujourd'hui la recombinaison et plus largement la mobilite 
et la plasticite de la sequence, comme des caracteristiques courantes et 
indispensables au fonctionnement et a la reproduction des etres vivants. 
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Figure 2.5 Mecanisme de la recombinaison homologue selon le modele de 
Holliday. Les lettres ABC et abc designent des regions homologues des ADN ou les 
sequences sont cependant legerement differentes. Les duplex hybrides resultant 
de la resolution de la jonction different selon le type de divage. 


2.2 • Les differents types de mutations modifant ou non la fonction 
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Cette realite se manifeste particulierement a la meiose, notamment lors 
de l’echange de fragments entiers de chromosomes, par recombinaison 
homologue, dans un processus connu sous le terme de « crossing 
over » (voir chapitre 6). Elle est egalement illustree par les rearrange- 
ments et les deplacements de sequences connues sous le nom de 
transposition. 

La recombinaison homologue existe chez tous les organismes. Son 
mecanisme fondamental repose sur la rupture suivie de la reunion de 
deux molecules d’ADN homologues, c’est-a-dire identiques sur des 
regions d’au moins une centaine de bases, ce qui n’exclut pas la possi- 
bility de differences comme il en existe entre deux alleles d’un meme 
gene. Les deux molecules recombinantes sont porteuses de cassures 
symetriques sur l’un ou les deux brins et un appariement croise s’etablit 
entre les brins des deux molecules qui se connectent ainsi en une 
structure designee par le nom de son decouvreur, la jonction de Holliday 
(Fig. 2.5). Cette structure de jonction migre le long des deux molecules 
d’ADN par separation progressive des simples brins. Le processus est 
appele migration de branche. II assure une hybridation croisee des 
brins des deux origines. Linalement, des clivages interviennent. Ils 
hberent deux duplex d’ADN ayant echange des regions de taille variable 
selon les circonstances. Cette operation se nomme resolution de la 
jonction. Selon le type de clivage (Fig. 2.5), le reassortiment des regions 
entre les deux ADN concernes par la recombinaison fournit soit des 
duplex commutes et croises, soit des duplex simplement commutes. 

2.2 LES DIFFERENTS TYPES DE MUTATIONS MODIFIANT 
OU NON LA FONCTION 

Les mutations geniques 

Ce sont tout d’abord les mutations ponctuelles, comme les insertions, 
les deletions et les substitutions qui appartiennent a la categorie des 
transitions et des transversions (voir Figure 2.2). Quand elles inter- 
viennent au sein d’une sequence genique codant une proteine, trois 
principales consequences peuvent en resulter : 

> La mutation sera dite « silencieuse » si l’acide amine n’est pas modifie 
ce qui est souvent le cas si le changement de base concerne la 
3 e position du codon (voir a ce sujet, le code genetique dans le Mini 
Manuel de Biologie moleculaire) 

> La mutation sera dite « faux sens » si l’acide amine est different de 
celui normalement code. 

> La mutation sera dite « non sens » si un codon stop est forme, ce 
qui aboutit a une proteine tronquee. 
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> Les mutations « faux sens » par substitution de bases, ainsi que les 
mutations « non sens », respectueuses du cadre de lecture, a l’origine 
de maladies humaines, sont les plus frequentes (59 %). Les deletions 
representent 22 % et les insertions/duplications, 7 %. Les mutations 
modificatrices des sites d’epissage et celles presentes dans les regions 
regulatrices des genes, representent environ 1 1 % (Tableau 2.1). 


Tableau 2.1 Frequence relative des types de mutation 

RESPONSABLES DE MALADIES HUMAINES. 


Mutation 

Nombre 

% du total 

Deletion 

6 085 

21,8 

Insertion/duplication 

1 911 

6,8 

Rearrangement complexe 

512 

1,8 

Repetition 

38 

0,1 

Non sens/faux sens 

16 441 

58,9 

Epissage 

2 727 

9,8 

Regulatrice 

213 

0,8 

Total 

27 027 

100 


L’effet d’une mutation ponctuelle est parfois annule par une deuxieme 
mutation qui restaure la base initialement presente (c’est une vraie 
reversion) ou qui intervient sur un deuxieme site grace auquel la fonc- 
tionnalite de la proteine sera restauree. C’est le cas d’une deletion qui 
interrompt le cadre de lecture qu'une insertion tres proche restaurera. 
C’est le cas aussi des ARN de transfert suppresseurs de mutations ou 
l’anticodon est porteur d’une mutation qui permet de lire un codon 
sens prealablement mute en codon stop. 

Les insertions peuvent comporter plusieurs bases ou nucleotides. 
Les elements transposables (transposons) ou les repetitions de bases 
(comme AC ou TG) presentes dans les microsatellites et incorrectement 
repliquees sont de bons exemples de ce type d’evenement. Lorsqu’ils 
se produisent a l’interieur d’une sequence genique les effets portent 
sur la sequence codante ou bien les sites d’epissage ce qui dans les 
deux cas, alt ere finalement la proteine. Le transposon peut cependant 
a son tour etre excise, ce qui restaure la sequence initiale. Dans le cas 
d’une deletion, la sequence codante d’un gene sera irreversiblement 
alteree (Fig. 2.6). 
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■ 7p22.3 


■ 7p1 1 .2 

■ 7q1 1 .22 


CFTR 

(genotype normal) 


AF508 CFTR 
(genoytype mutant) 


506 507 508 509 510 

- ATC ATC TTT GGT GTT 

I I F G V 

506 507 508 509 

-ATC ATT GGT GTT 




■ 7q31 .2 — CFTR 


La phenylalanine 508 est mutee 
chez la majorite des patients 
atteints de mucoviscidose 


7q36.3 

Chromosome 7 


Figure 2.6 Deletion de trois bases dans la sequence ADN du chromosome 7 
humain. 

Cette deletion tres frequente chez les patients atteints de mucoviscidose, elimine une 
phenylalanine de la sequence polypeptidique avec comme resultat d'inactiver la proteine 
qui controle le passage des ions chlore a travers la membrane des tissus secreteurs ce qui 
bloque leur fonctionnement normal par un encombrement du aux mucosites et autres 
secretions qui ne sont pas evacuees. 


Les mutations chromosomiques : 
amplifications, deletions, translocations, 
inversions, perte d'heterozygotie 

Les mutations peuvent interesser des regions entieres de chromosomes. 
Ce sont des evenements qui se produisent au moment de la division 
cellulaire lorsque des recombinaisons ont lieu, particulierement au 
moment de la meiose donnant naissance aux gametes. Ces derniers 
transmettront a la descendance la mutation chromosomique dont ils 
sont porteurs. Comme pour les mutations ponctuelles, les mutations 
chromosomiques se presentent sous la forme de duplications (ou ampli- 
fications) et de deletions de regions entieres qui amenent souvent la 
fusion de genes a l’origine separes. Dans ce dernier cas, il peut s’agir de 
translocations ou d’inversions de fragments entre deux chromosomes. 
L’evenement se trouve souvent a l’origine de fusions geniques dont 
les produits sont des proteines de fusion, parfois responsables de 
processus de tumorisation et de cancers (Fig. 2.7). C’est le cas par 
exemple de la deletion chromosomique conduisant a la fusion des genes 
FIG et ROS et a la production d’une proteine de fusion possedant une 
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■ Deletion 



Chr. 9 


■ Insertion 


■ Duplication 



■ Inversion 




W 


Chr. 9 Chr. 9 



W 
Chr. 1 


■ Translocation 


Chr. 20 



Figure 2.7 Les cinq principaux types de mutations chromosomiques. 
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activite permanente de tyrosine kinase, ce qui a pour effet la transfor- 
mation tumorale des cellules gliales et de provoquer un cancer du 
cerveau. 

Dans un organisme qui presente deux alleles differents pour un 
meme gene (etat heterozygote), la deletion ou un evenement de 
recombinaison specifique peuvent conduire a la perte de l’un des deux 
alleles et a la perte de l'heterozygotie. 

Les mutations pertes ou gains de fonction 

Les effets phenotypiques consecutifs a une mutation sont parfois 
utilises pour qualifier la mutation elle-meme. C’est ainsi qu’on parle 
de mutations « perte de fonction » ou « gain de fonction ». Lorsque 
la perte de fonction est consecutive a l’inactivation ou la disparition 
de l’un des deux alleles d’un gene, on parle d’ allele nul et la mutation 
est dite amorphique (sans phenotype). Tres souvent de telles mutations 
sont recessives, sauf lorsque qu’elles concernent des organismes 
haploides (presence d’un seul genome) ou que le phenotype, pour etre 
exprime, necessite l’activite des deux alleles du gene d’un organisme 
diploide. Dans ce cas, on parle d’haploinsuffisance pour signaler une 
expression incomplete du phenotype, due a la perte d’activite de l’un 
des deux alleles. 

Les mutations dites « gain de fonction » modifient le produit du gene. 
L’ ARN ou la proteine acquiere une fonction nouvelle qui change gene- 
ralement le phenotype observe chez 1’ organisme considere (mutation 
neomorphique). Ces mutations sont generalement dominantes. 

11 existe un type de mutation dite « dominante negative » dont 
l’action se manifeste par une alteration de l’effet de l’allele de type 
sauvage responsable du phenotype habituel. Le produit altere (ARN 
ou proteine) de 1’ allele mute, interagit negativement avec le produit de 
1’ allele sauvage qui ne peut alors exprimer pleinement son effet pheno- 
typique. Un bon exemple en est donne par le syndrome de Marfan, 
une maladie genetique humaine due a une mutation du chromosome 
15 touchant le gene FBN1 qui code la fibrilline 1, une glycoproteine 
essentielle pour la formation des fibres elastiques des tissus constitutifs 
des ligaments associes a la formation du squelette et a son equilibre, 
mais aussi constitutifs de l’aorte et de l’ceil. En se liant au facteur de 
croissance TGFp, la fibrilline controle son niveau d’activite. La mutation 
du gene FBN1 reduit le niveau de la fibrilline et un exces de TGF() en 
resulte qui est a l’origine du syndrome. 

Les mutations dites letales conduisent a la mort de l’organisme 
porteur. Lorsqu’elles se manifestent au stade embryonnaire precoce, 
l’embryon meurt et les mutations restent souvent de ce fait, ignorees. 
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Autres types de mutations : 

phenotypiques, biochimiques et conditionnelles 

Parce qu’elles affectent l’aspect de l’organisme porteur certaines 
mutations sont dites « morphologiques ». Elies se manifestent par des 
modifications de la taille ou de l’aspect d’un organe. De telles mutations 
ne sont pas necessairement associees a des changements de la sequence 
genomique. Elies resultent souvent d’ alterations epigenetiques dont 
l’origine se trouve dans Paction de facteurs environnementaux. Parfois 
cependant un mutant morphologique resulte directement d’une mutation 
dans Pun des composants d’une voie enzymatique. On parle alors de 
mutation « biochimique » (voir chapitre 5). Dans d’autres circonstances, 
ce sont les conditions environnementales qui imposent le phenotype 
correspondant. Ainsi une mutation sensible a la temperature provoquera 
la mort cellulaire si la temperature s’avere trop elevee (conditions 
restrictives) alors qu’aplus basse temperature (conditions permissives) 
la cellule survivra. 

Nomenclature 

II existe une nomenclature simple pour designer les mutations ponc- 
tuelles qui sont des substitutions ou des deletions. On ecrira par exemple 
Q213H pour nommer la substitution de la glutamine en position 213 
par Phistidine. Q designe la glutamine dans le code international a 
une lettre, 213 designe la position de la glutamine a partir de l’extre- 
mite N de la proteine et la lettre H, Phistidine qui est substitute a la 
glutamine. 

Dans le cas d’une deletion, on ecrit AQ213. Le signe grec A (delta) 
indique la deletion. La lettre Q designe la glutamine presente dans la 
sequence de type sauvage et le nombre designe la position ou se trouve 
la glutamine a partir de l’extremite N de la proteine. 

On precede de fag on similaire pour designer les mutations affect ant 
les bases puriques et pyrimidiques de l’ADN et de l’ARN. 

2.3 LA NOTION DE PARAMUTATION 

Cette notion fait reference a l’existence d’une interaction entre les 
deux alleles d’un locus. En effet, dans la paramutation, un des deux 
alleles presents a une generation affecte de fagon heritable P autre 
allele dans les generations ulterieures, meme si P allele responsable du 
changement n’est pas lui-meme transmis. La paramutation constitue 
done une exception a la regie mendelienne de la segregation indepen- 
dante des alleles. Quel est le support physique qui est responsable de 
la transmission de l’information genetique dans un tel phenomene ? 
La reponse designe aujourd'hui de petits ARN, sous toutes les formes 
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male Kit tm1Alf/+ X 




■ ARNm de Kit 
OC-) aberrant 

Spermatozoi'des 



Ovule 


Embryon 


FI 



X 




Figure 2.8 Paramutation du gene Kit chez la souris. 

A la generation FI, bien que les souris males aient un 
genotype de type sauvage +/+, le phenotype de leur 
queue correspond a un genotype mute K/'f tmM# /+.Croises 
avec des femelles de type sauvage +/+, les individus F2 
continuentde presenter, quoique souventa un moindre 
degre, le phenotype mutant. L'extremite de la queue de 
souris males possedant un allele paramutagenique 
et un allele de type sauvage (+) est blanche au lieu d'etre 
coloree. L'allele Kit tmlAlf produit un ARNm incorrect qui 
est embarque dans le sperme et transmis a I'embryon 
apres fecondation de I'ceuf. Meme si les descendants 
possedent les deux alleles sauvages, ils expriment cepen- 
dant un phenotype dit « extremite de la queue blanche ». 
Ce phenotype est du a Faction de I'ARNm Kit tm,M qui 
provoque soit une degradation ciblee interferentielle de 
I'ARNm sauvage, soit un blocage de sa traduction. La 
disparition progressive au cours des generations succes- 
sives de I'ARNm Kit ,mlAlf incorrect ou de ses produits 
inhibiteurs derives conduit progressivement a une perte 
de la paramutation. 
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non codantes connues. Ces ARN sont transmis par les cellules sexuelles 
(gametes) de generation en generation. L’ARN doit done etre considere 
a part entiere comme une molecule de Fheredite. 

Des exemples sont connus chez les vegetaux. L’ allele paramuta- 
genique R st au locus R peut influencer 1’ allele dominant paramutable R R . 
R sl peut meme, au long des generations, controler un large eventail de 
phenotypes de coloration chez le mats, depuis l’absence de couleur 
des grains jusqu’a la plus intense des colorations. Un tel phenomene 
est egalement rencontre chez les mammiferes (Fig. 2.8). 

2.4 EFFETS DES MUTATIONS 
Effets defavorables 

La plupart des mutations, notamment celles qui sont ponctuelles ou 
celles qui ne concernent qu’une region tres limitee du genome n’ont 
pas d’effet phenotypique. Elies sont dites neutres. Les effets indesirables 
se manifestent par contre des qu'une mutation de l’ADN, non corrigee 
par le systeme de reparation, modifie : 

> la sequence d’une proteine au point d’alterer sa fonction moleculaire, 

> la quantite du produit du gene ou de la region mutee, qu’elle code 
une proteine, meme si la fonction de celle-ci n’est pas alteree, ou 
un ARN qu’d soit lui-meme codant ou non codant 

> la localisation subcellulaire du produit du gene (ARN ou proteine). 
Le resultat aboutit a une alteration du fonctionnement de la cellule 

cible de la mutation et ce desordre genetique, generateur d’un effet 
phenotypique souvent defavorable se transmettra a la descendance si la 
cellule en question appartient a la lignee germinale (lignee formatrice 
des gametes) de l’individu. 

Effets favorables 

11 arrive cependant que certaines mutations aient des effets positifs et 
conferent aux organismes qui en sont porteurs des proprietes qui 
ameliorent leur adaptation aux changements environnementaux. Deux 
exemples concernant l’espece humaine sont particulierement demons- 
tratifs de ce phenomene. L’un des cas conceme les personnes porteuses 
d’une mutation ponctuelle de la globine (un acide glutamique est 
substitue par la valine) responsable de l’anemie falciforme (l’agregation 
de 1’hemoglobine deforme les hematies qui adoptent une forme en 
faucille et circulent mal) mais qui sont par contre en raison de cette muta- 
tion resistante a la malaria (paludisme), l’agent infectieux ( Plasmodium ) 
etant mal transports. 

L’ allele responsable est un allele autosomal (chromosome 11) recessif. 
A l’etat heterozygote, les porteurs de la mutation ne presentent que 
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quelques hematies deformees et ne sont pas anemies, mais cela suffit 
pour leur conferer la resistance a la malaria. C’est un cas oil l'hetero- 
zygotie d’un allele confere au porteur un avantage sur les deux genotypes 
homozygotes. 

L’ autre cas concerne une deletion de 32 bases dans le gene codant 
un recepteur de cytokines nomme CCR5 qui est exprime preferentiel- 
lement dans les lymphocytes T, les macrophages et les cellules 
dendritiques. Ce recepteur est utilise par le VIH (vims du sida) comme 
corecepteur pour coloniser les lymphocytes T. Sous sa forme mutee 
(CCR5-A32) il est non fonctionnel et confere aux porteurs homo- 
zygotes une resistance a l’infection par le VIH ; pour les heterozygotes, 
il retarde le processus infectieux. Cette mutation, plutot rare, n’affecte 
pas la sante des porteurs qui sont plus frequents dans les populations 
europeennes ou sa presence serait liee a une selection naturelle inter- 
venue vers le milieu du xiv e siecle vis-a-vis de la peste bubonique 
qui sevissait alors en Europe. En effet, 1’ agent bacterien de la peste 
( Yersinia pestis) utilise egalement CCR5 pour coloniser les cellules 
du systeme immunitaire. 

2.5 LA NOTION DE SELECTION 

La selection est un processus biologique complexe a la base de 
1’evolution des especes. Il se deroule dans la nature (selection natu- 
relle) mais peut aussi etre dirige a son profit par l’homme (selection 
artificielle). 

La selection naturelle 

La selection, sous sa forme naturelle theorisee en 1859 par Charles 
Darwin, aboutit a ce que les caracteristiques (traits phenotypiques) favo- 
rables, transmises entre individus capables de se reproduire deviendront 
de plus en plus frequentes chez les descendants au cours des genera- 
tions successives. Si les caracteristiques ainsi selectionnees ont une 
base genetique, au sens des decouvertes faites a la meme epoque par 
Gregor Mendel, le genotype correspondant deviendra egalement de 
plus en plus frequent dans les generations suivantes. De faqon syme- 
triquement inverse, la frequence des caracteristiques defavorables et 
celle de leurs genotypes correspondants diminueront progressivement. 

La selection naturelle peut se manifester a divers stades du cycle 
vital d’un organisme ayant une reproduction sexuee (Fig. 2.9). 

11 arrive que la selection naturelle de leurs caracteristiques pheno- 
typiques assure aux individus porteurs une excellente adaptation au 
milieu dans lequel ils vivent (niche ecologique). Le maintien d’une 
telle selection basee sur un processus interactif entre genotype et 
milieu peut aboutir finalement a l’emergence d’une nouvelle espece. 
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Zygote 




Reproducteurs 



Figure 2.9 Identification des divers stades du cycle vital d'un organisme oil 
s'exerce avec des effets majeurs la selection naturelle. 

Capacity a se reproduire (ne pas disparaitre avant d'etre capable de se reproduire), 
Competition sexuelle (competition entre adultes pour se reproduire), Nombre de 
descendants (et duree de la periode d'aptitude a la reproduction), Fecondite croisee 
(fecondite relative male et femelle), Viability et selection des gametes (suivant les 
evenements de recombinaison meiotique), Compatibility des gametes (plus ou moins 
grande compatibility sperme-ovule). 


Cette idee simple repose sur le concept d’ adaptation et demeure 
aujourd’hui encore a la base de la theorie de F evolution des especes 
vivantes, meme si celle-ci s’enrichit depuis les annees 1950, de 
nombreuses connaissances cellulaires et moleculaires. 

On retrouve le concept d’adaptation (et d’ adaptability) dans la 
celebre expression decrivant la selection naturelle comme « la survie 
du plus apte », expression que l’on remplace volontiers aujourd’hui 
par « le plus apte est celui qui peut le mieux se reproduire ». En effet, 
si un individu vit deux fois moins longtemps que les autres de la meme 
espece, mais qu’il engendre deux fois plus de descendants capables 
eux-memes de se reproduire, ses genes seront bien mieux representes 
dans les generations suivantes que ceux de ses congeneres. 

Le concept d’adaptation d’un organisme depend done en premiere 
approximation de 1’ adaptability des alleles (genes) qui Font fagonne. 
Mais, F adaptability d’un individu particulier se refere habituellement 
a un trait ou un ensemble de traits phenotypiques. II est alors preferable 
de relier plus simplement F adaptability de F individu a F adaptability de 
son genotype. On ne doit pas oublier cependant que F adaptability 
exprime la valeur selective moyenne d’une population et non la valeur 
selective d’un individu de cette population. C’est ainsi, en appui de 
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cette observation, qu’un allele porteur d’une mutation favorable, apparue 
chez un individu qui cependant disparait accidentellement avant de 
pouvoir se reproduire, aura une adaptabilite selective nulle, bien que 
le trait phenotypique resultant ait pu etre benefique pour l’organisme 
en question. 

Finalement, la selection naturelle peut aboutir a ce que la frequence 
d’un allele augmente parce que son adaptabilite sera plus grande que 
celle des autres alleles. II peut arriver meme que 1’ allele soit fixe, 
c’est-a-dire que sa frequence soit de 1 (aucun autre allele n’est present 
dans la population). II peut arriver a I ' i nverse que la selection main- 
tienne a un faible niveau un allele ayant un effet defavorable sur le 
phenotype, le processus pouvant aller parfois jusqu’a L elimination de 
ce dernier (frequence 0). La situation la plus courante cependant est 
celle du maintien d’un allele avec une frequence intermediate dans la 
population. C’est souvent le cas des organismes diploides ou les indi- 
vidus heterozygotes porteurs de deux alleles differents (un sur chaque 
chromosome homologue) possedent une meilleure adaptabilite que 
les individus homozygotes porteurs de deux alleles identiques. L’un 
des exemples les mieux connus de ce processus est celui des porteurs 
de L allele du gene de la globine conferant une resistance a la malaria. 
Cet allele, a l’etat homozygote, est par ailleurs responsable de 
l’anemie falciforme. Dans cette maladie, l’hemoglobine s’agrege de 
telle maniere que les globules rouges se deferment en forme de faucille 
ou de croissant et circulent tres mal dans les vaisseaux, d’ou une 
anemie qui peut etre fatale. Les individus heterozygotes possedent 
cependant suffisamment de globine normale et ne sont pas anemies ; 
ils sont, par ailleurs, resistants a la malaria. De faijon etonnante, 
l’heterozygotie leur confere une survie et une capacite a se reproduire 
superieure aux deux formes d’homozygotie. D’autres exemples de 
selection de l’heterozygotie sont connus, les plus inattendus etant ceux 
qui semblent responsables ou associes a la selection avantageant la 
parentele et les comportements d’altruisme reciproque. 

Dans sa version la plus etonnante, l’altruisme consiste pour un orga- 
nisme (unicellulaire ou multicellulaire) a se « sacrifier » afin d’apporter 
a ceux qui lui sont les plus proches genetiquement, sa fratrie en quelque 
sorte, un secours essentiel a leur survie, avec comme consequence, a 
defaut de promouvoir la diffusion de ses propres genes, de favoriser la 
diffusion de genes apparentes. De nombreux exemples ont ete identifies 
et interprets avec cette grille de lecture. Ils vont des bacteries et 
protistes jusqu’aux mammiferes et a l’homme. Lorsque les conditions 
environnementales deviennent defavorables (manque de nourriture) 
les myxobacteries et les myxomycetes qui vivent normalement a l’etat 
unicellulaire, s’agregent, ferment des colonies ou certaines cellules 
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meurent afin d’ assurer la survie des autres. Ce type de comportement 
assimilable a un comportement social se retrouve chez le nematode C. 
elegans ou une mutation ponctuelle dans un neuropeptide determine 
le comportement alimentaire, individuel ou de groupe. II est rencontre 
aussi chez les mammiferes ou certains individus n’hesitent pas a se 
designer aux predateurs par un signal d’alerte, favorisant ainsi la fuite 
des autres individus qui lui sont apparentes. Certains auteurs tirent de 
ces observations des arguments en faveur de l’idee que les mecanismes 
assurant la survie et la propagation des genes sont particulierement 
efficaces du point de vue de l’evolution. Certains autres auteurs vont 
jusqu’a considerer que les comportements solidaires et charitables de 
certains individus de l’espece humaine ne repose pas sur des facultes 
morales superieures, fruits du progres de la civilisation et correctrices 
d’une sorte egoisme genetique, mais plutot sur des circuits neuronaux 
primitifs, habituellement actives dans les relations de satisfaction et de 
plaisir procurees par la nourriture, l’activite sexuelle ou la relation sociale. 

La selection artificielle 

C’est la selection pratiquee par les cultivateurs, les eleveurs et les 
societes ou organismes producteurs de semences vegetales et animales. 
Elle repose sur le fait que la plupart des traits phenotypiques des 
especes vivantes exploitees par i’homme dependent, lorsqu’ils ont une 
base hereditaire, de l’interaction de nombreux genes. Les variations 
de ces traits, lorsqu’elles sont dues a un seul gene, ne produisent done 
a chaque etape de selection qu’un effet quantitatif tres faible sur les 
phenotypes. Dans une espece, une race animale ou une variete vegetale, 
les phenotypes d’interet se presentent ainsi sous la forme de series 
continues au sein desquelles les selectionneurs cherchent par des accou- 
plements diriges, a stabiliser ou a eliminer, les traits qu'ils jugent 
favorables ou defavorables. 11s operent generalement en procedant a 
une selection par troncature (Fig. 2.10 et 2.11). Tous les individus 
ayant une valeur pour le trait d’interet superieure a une valeur seuil, 
sont selectionnes et utilises comme reproducteurs. La valeur S ou ecart 
selectif est definie comme l’ecart impose entre la valeur moyenne du 
caractere pour la sous-population des reproducteurs selectionnes a la 
generation d’origine et la valeur determinee pour l’ensemble de la 
population parentale (generation 1). La reponse R a la selection ou 
progres genetique represente la difference entre les moyennes etablies 
pour deux generations successives. Elle montre que la superiorite 
genetique des individus selectionnes a ete transmise a leurs descen- 
dants. Le rapport R/S (reponse de selection sur ecart selectif) mesure 
l’augmentation de la valeur additive, e’est-a-dire l’heritabilite du 
caractere considere. 
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Mesure 
du caractere 

Figure 2.10 Principe de la selection par troncature apres etablissement de la 
courbe de distribution du caractere que le selectionneur veut ameliorer. 

La generation 2 resulte d'un croisement entre reproducteurs.selectionnes a la genera- 
tion I.On observe un progres genetique R,en reponse a la selection. S mesure I'ecart 
selectif. En conservant le meme point de troncature au cours des generations successives, 
on enregistre a la generation x, un deplacement tres significatif de la courbe de distri- 
bution, vers la droite.Cela signifie que le progres genetique, pour le caractere concerne, 
est devenu pour la majorite de ia population, superieur au point de troncature, fixe en 
debut deselection. 
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Tant qu’une variability genetique existe entre les individus d'u lie 
population soumise a la selection artificielle, un progres genetique 
peut etre enregistre. A partir d’un certain nombre de generations, la 
variance genotypique additive du caractere comme son heritabilite 
seront nulles. Tous les individus selectionnes au fil des generations 
auront theoriquement le meme genotype, du a la fixation des alleles 
responsables de l’accroissement de la performance pour le caractere 
choisi. 



Figure 2.1 1 Reponse des animaux soumis a une selection artificielle par troncature. 

Les reproducteurs sont selectionnes par troncature aux deux extremites de la courbe 
de distribution du caractere (voir figure 2.10). Au fil des generations, cette selection 
produit des populations qui divergent fortement pour le caractere concerne (ici le 
poids de graisse ramene a la carcasse). L'application systematique d'une telle selection 
au fil des generations produit des populations A et B qui divergent fortement pour le 
caractere considere. 


Relations entre selection et variation genetique 

II doit etre note qu’une partie importante de la variability genetique 
(la difference de genotypes) observee entre les individus s’avere sans 
effet sur les phenotypes et n’ influence pas non plus 1’ adaptability des 
individus. On dit de cette variability associee a la diversity qu’elle est en 
verite neutre du point de vue de revolution selon la theorie proposee 
par Motoo Kimura. Autrement dit il n’y a pas de relation directe entre 
la variation genetique et des differences dans 1’ adaptability des indi- 
vidus constitutes d’une population. Les mutations qui interviennent 
dans le genome sans modifier son expression seraient sans effet sur 
cette adaptability. On a pense pendant longtemps que les mutations 
neutres concernaient principalement l’enorme fraction des genomes qui 
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n’est pas occupee par les sequences codantes des genes a l’origine des 
proteines. Que des mutations interviennent dans ces regions n’avaient 
pas d’ importance puisque les proteines a l’origine des phenotypes 
n’etaient pas concernees. Cette conception fait place maintenant a une 
vision tres sensiblement differente depuis que l’on sait que les regions 
non codantes de l’ADN sont majoritairement transcrites et que les 
ARN non codants influencent fortement l’expression des genes et done 
les phenotypes. 11 est a prevoir que de nouvelles theories a propos de 
la selection naturelle et de ses rapports avec 1’ evolution, integrant les 
donnees concemant la nature des genes et leur expression verront le 
jour dans les prochaines annees. La conception que l’on se fait de la 
balance entre mutations et selection peut s’en trouver modifiee. La 
selection est en effet un processus qui en eliminant les mutations 
defavorables a une adaptation environnementale reduit la variabilite 
genetique apportee par les mutations. Dans le meme temps, de nouvelles 
mutations, aleatoires, se produisent qui realimentent la variabilite gene- 
tique au sein d’une population. Une balance, un equilibre s’etablit entre 
les deux processus (vitesse d’ apparition des mutations et elimination 
des mutations defavorables). De cette balance resulte en quelque sorte 
la force propulsive de revolution. 

2.6 LA DISTINCTION ENTRE PHENOTYPE ET GENOTYPE 

Le phenotype d’un etre vivant correspond a son apparence physique 
d’ensemble ou bien a un aspect particulier (on dit aussi une caracteris- 
tique, un trait) mesurable de cette apparence generale, comme sa 
taille, son poids, sa couleur, une forme, une propriete, une aptitude ou 
un comportement qui varient suivant les individus examines. Pour une 
large part, le phenotype depend du genotype, autrement dit des genes 
et surtout de leurs alleles presents dans les chromosomes de l’individu. 
La plupart des phenotypes sont determines par de nombreux genes et 
sont influences par les facteurs physico-chimiques et biologiques de 
l’environnement dans lequel vit l’individu ou la population a laquelle 
il appartient. 

La description du phenotype d’un individu s’avere en general plus 
facile a realiser - par de simples mesures structurales, biochimiques, 
physiologiques ou comportementales - que celle de son genotype qui 
necessite d’acceder a la sequence de l’ADN. On ne sait en effet etablir 
cette sequence que depuis quelques dizaines d’ annees seulement. Aupa- 
ravant les geneticiens deduisaient la fonction des genes a partir du seul 
examen des phenotypes. La genetique classique ou genetique directe 
part done des phenotypes pour alter vers les genotypes, a l’aide souvent 
de mesures et d’ analyses quantitatives portant sur les phenotypes 
(genetique quantitative). Avec les progres de la biologie moleculaire, 
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une genetique inverse se developpe qui part des genotypes et parfois 
des genomes entiers, pour connaitre les phenotypes. Adeptes de la 
premiere genetique, cultivateurs et eleveurs, integrent aujourd’hui les 
demarches de la genetique moleculaire dont la puissance predictive 
des phenotypes s’accroit avec les progres realises dans la connais- 
sance approfondie des genomes entiers (sequencage et genotypage). 

Les differences constatees entre les phenotypes individuels sont 
revelatrices de la variability genetique existant entre les individus. On 
l’a vu, la selection naturelle agit sur les phenotypes en favorisant ou 
non les individus dont les phenotypes assurent la plus ou moins bonne 
adaptability a l’environnement. Sans differences phenotypiques, il ne 
pourrait y avoir de differences dans 1’ adaptability et par voie de 
consequence pas de selection naturelle et pas devolution. 

Le jeu complexe qui s’etablit entre phenotype, genotype et milieu 
est parfois represente par la relation : 

genotype + environnement -» phenotype 
ou, mieux encore afin de tenir compte des variations aleatoires, par la 
relation : 

genotype + environnement + variation aleatoire phenotype 

Ces relations expriment d’une maniere simpliste les interactions 
qui s’etablissent entre les genes et l’environnement. Elies expriment 
egalement les termes du debat classique et toujours d’actualite entre 
ce qui appartient a l’inne (heritable par les genes) et ce qui appartient 
a l’acquis (apporte ou non par V environnement). Dans l’exemple de la 
phenylcetonurie (voir chapitre 1) un regime alimentaire approprie, 
depourvu de phenylalanine suffit a eviter que la maladie genetique se 
manifeste. II s’agit la d’un exemple classique des relations entre gene 
(mute) et environnement (alimentation). II existe aussi des circonstances 
ou des organismes porteurs d’un genotype particulier agissent de telle 
maniere qu'ils modifient ou choisissent leur propre environnement. 
Dans ce cas, il s’agit d’un processus inverse de celui, illustre par 
1’ exemple de la phenylcetonurie. L’environnement est cree par le geno- 
type. De tres nombreux exemples sont donnes par les comportements 
de diverses especes comme, par exemple ceux des populations humaines 
dans la mise en oeuvre de leurs habitats. 

2.7 LIAISON GENETIQUE ET DESEQUILIBRE DE LIAISON 
Liaison genetique et selection 

Contrairement aux observations de G. Mendel, certains genes ne segre- 
gent pas a la meiose de fa<jon independante. Quand les locus de deux 
genes sont lies ou tres proches l’un de 1’ autre sur le meme chromo- 
some, on dit qu’existe une liaison genetique. Au cours de la formation 
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des gametes, un brassage du materiel genetique s’opere grace a des 
croisements par recombinaison (« crossing over »). Plus les genes 
sont proches les uns des autres sur un chromosome, plus faible est la 
probabilite qu’un evenement de recombiaison entre chromosomes 
vienne a les separer. 11 en resulte que si l’un des genes est l’objet 
d’une selection (naturelle ou artificielle), les autres genes qui lui sont 
proches ont toutes les chances d’etre eux aussi selectionnes. Au final, 
la selection agit sur le potentiel de variation du genome et suivant les 
circonstances et l’echelle de temps consideree, elle peut ou non 
appauvrir la variability intrinseque du genome, objet de la selection. 

Par une selection systematiquement dirigee, il peut arriver qu’un 
gene (un allele de ce gene), responsable d’un phenotype recherche par 
l’eleveur ou le cultivateur, voit augmenter sa frequence au sein de la 
population. Les alleles qui lui sont lies au locus chromosomique qu’ils 
occupent verront du meme coup egalement leur frequence augmenter, 
quelle que soit leur action effective (neutre, positive ou negative). 
Poussee a l’extreme, une telle selection conduira a fixer dans la popu- 
lation et pour la region genomique consideree, un seul haplotype, 
c’est-a-dire une seule combinaison allelique (P allele du gene cible de 
la selection et les alleles des genes lies voisins). 

Liaison genetique entre deux caracteres presents 
dans un familie humaine 

11 s’ agit ici de la liaison genetique entre deux caracteres phenotypiques 
exprimes ou portes par le chromosome X humain (Fig. 2.12). Le 
premier caractere est un retard mental (represente sur la figure par un 
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(J) [J] chromosome X « fragile » 

Figure 2.12 Genealogie d'une familie humaine ou s'observe chez les gargons 
une liaison genetique entre un retard mental et la presence d'un site fragile sur le 
chromosome X. 

Le symbole en losange barre correspond a la detection du site fragile lors d'un diagnostic 
prenatal. 
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symbole male ou femelle a moitie noir, voir Fig. 1 . 7 pour la signification 
des symboles). Le second caractere se rapporte a un aspect particulier 
du chromosome X qui peut presenter un site dit « fragile », une 
amorce de cassure souvent visible, chez les individus porteurs, dans 
les cellules en metaphase (represents ici par le grise de la partie droite 
des symboles). 

Le retard mental est recessif et n’est done pas detecte chez les meres 
« transmetteuses ». En effet bien qu’elles soient porteuses d'u n chromo- 
some X avec un site fragile, et que celui-ci soit detecte sans ambiguite, 
elles ne presentent pas de retard mental puisque leur deuxieme chromo- 
some X est normal. En examinant les gargons de la famille, on constate 
que les deux caracteres (retard mental et site fragile du chromosome X) 
sont totalement correles. Cela signifie que les determinants genetiques 
de ces deux caracteres sont tres proches sur le meme chromosome (en 
roccurrence ici le chromosome X). Le chromosome Y des gargons, 
d'une taille reduite et avec peu de genes (voir chapitre 3), ne comporte 
pas les determinants genetiques (les alleles) du chromosome X. 11 ne 
compense done pas 1’ absence du deuxieme chromosome X. 

Le desequilibre de liaison mesure une distribution 
non aleatoire de marqueurs genetiques 

Le desequilibre de liaison decrit la situation qui dans une population 
resulte de certaines combinaisons d’alleles ou de marqueurs genetiques 
dont la frequence differe de celle qu’on attend d’une formation aleatoire 
d’haplotypes. Autrement dit, les associations non aleatoires entre genes 
(alleles) a differents loci sont mesurees par le degre de desequilibre de 
liaison. 

L’ etude des liaisons entre genes conduit souvent a designer une 
region chromosomique de quelques megabases comme porteuse d’un 
locus associe a un trait phenotypique d’interet (designe parfois par le 
terme QTL, pour Quantitative Trait Loci). II s’agit souvent chez 
1’homme du locus ou se trouvent les determinants d’une maladie 
genetique ; chez l’animal ou la plante, d’un locus associe a un caractere 
phenotypique interessant le selectionneur. Puisque plusieurs centaines 
de genes sont susceptibles d’etre localises dans cette region chromo- 
somique, analyser chacun d’eux s’apparente a une mission impossible. 
L’ alternative peut consister non pas a etablir 1’ existence d’une liaison 
genetique entre un marqueur polymorphe et la maladie ou le QTL, par 
T etude de quelques generations d’individus au sein d’un petit nombre 
de families, mais au contraire a montrer la coexistence d’un polymor- 
phisme de marqueurs avec le QTL ou la maladie. On realise pour cela 
des etudes dissociation au sein d’une population entre des marqueurs 
polymorphes et le gene fonctionnel (ou le determinant genetique) 
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responsable du caractere phenotypique analyse (maladie ou trait quan- 
titatif interessant). Le raisonnement est base sur le fait qu’en raison de 
la grande proximite physique entre le marqueur et le gene (ou le deter- 
minant genetique) un grand nombre de generations sont necessaires 
pour qu’ils soient separes par recombinaison. On s’attend done a ce 
que les individus porteurs du caractere analyse presentent le meme 
haplotype de marqueurs avec une frequence plus elevee que celle qui 
est attendue d’une distribution aleatoire, meme si les individus sont 
apparentes. Aujourd'hui les marqueurs polymorphes les plus informatifs 


Mutation ponctuelle 

Nucleotide variant responsable 
d'une maladie ou d'un QTL 

I 

ADN i i i i i i i i i I Haplotype ancestral 

AT A X G C T G 


Multiples recombinaisons 


ADN i III il I I d I l l 11 I Haplotype actuel 1 

[g] t a x g c t g 

ADN I I I I I li ~ 0 H JT_ I Haplotype actuel 2 

AT A X G C T [A] 

ADN I I ll ~H~' i [i ~ ll HZ ll i Haplotype actuel 3 

AT A X G C [A] [A] 

ADN I I II I I 0 II il ll i Haplotype actuel 4 

AXG C T G 

Figure 2.13 Illustration simplifiee de la distribution non aleatoire de marqueurs 
SNP dans une region chromosomique ou doit se trouver une mutation responsable 
d'un trait phenotypique caracteristique de tous les individus analyses. 

On suppose dans iexemple que cette mutation est responsable d'un trait quantitatif 
(QTL) chez I'animal ou la plante ou d'une maladie chez I'homme et qu'elle s'est produite 
anterieurement dans une region caracterisee par I'haplotype ATAGCTG. Elle est designee 
ici par la lettre X. Au cours des generations successives cet haplotype a subi des recom- 
binaisons. Ainsi, a titre d'exemple, la formation de I'haplotype 1 actuel resulte d'un 
evenement de recombinaison qui s'est produit entre les 1 er et 2 nd SNP. Les nouveaux 
alleles qui se sont ainsi progressivement formes au fil des generations sont identifies 
dans un carre de couleur rose. La plus petite signature haplotypique conservee (AGC) 
entre tous les individus porteurs du phenotype d'interet, e'est-a-dire en desequilibre 
de liaison, montre que la mutation responsable du QTL ou de la maladie pourrait bien se 
situer entre les SNP 3 et 4 qui sont les plus proches I'un de I'autre et les moins suscep- 
tibles d'etre recombinants. Cette demarche de cartographie des haplotypes SNP permet 
ainsi d'identifier une region candidate de taille limitee contenant la mutation d'interet 
dont I'identification definitive sera rendue accessible par exemple par des resequences 
en serie. 


52 


Chapitre 2 • Mutations et selection 


dans la recherche des regions genomiques associees a des traits pheno- 
typiques d’interet sont les SNP (Single Nucleotide Polymorphism) 
c’est-a-dire les nucleotides dont la nature de la base purique ou pyri- 
midique (A, T, G, C) varie (est polymorphe) selon les individus 
examines (Fig. 2.13). La coexistence chez un meme individu de deux 
genomes parentaux conduit au fait qu’un SNP peut se presenter sous un 
etat heterozygote (les deux bases des deux genomes sont differentes) ou 
sous Tun des deux etats homozygotes (les deux bases sont identiques, 
chaque paire correspondant a l’une ou l’autre des bases de l’etat hetero- 
zygote correspondant). 

L’exemple de la figure 2.13 montre que le desequilibre de liaison 
est du a plusieurs facteurs parmi lesquels on peut citer : 

> la distance genetique entre loci ; 

> la distance chronologique, c’est-a-dire l’anciennete de la mutation 

qui a genere le polymorphisme. 

Le desequilibre de liaison peut s’ exprimer par la formule suivante 
ou D obs represente la valeur mesuree du desequilibre de liaison, D la 
valeur maximale theorique du desequilibre de liaison et r le taux de 
recombinaison : 

D obs = (1 - r)D 

Chez les organismes qui se reproduisent de fagon asexuee et ou par 
consequent n’existe pas en principe de recombinaison genetique entre 
chromosomes parentaux (r = 0), le desequilibre de liaison est maximal 
et egal a 1 (tous les genes sont lies et transmis ensemble sans recom- 
binaison). 

2.8 HEREDITE ET HERITABILITE 

La notion d’heredite designe le processus de transmission des caracte- 
ristiques biologiques d'un parent a sa descendance. Les genes ayant 
comme support chimique principal l’ADN, l’heredite designe par 
consequent le processus de transmission des instructions genetiques 
portees par cette molecule, d’un parent a sa descendance. Certes, ces 
instructions (l’inne) ne sont pas les seules causes des caracteristiques 
biologiques d’un individu puisque l’on sait que des facteurs environ- 
nementaux (L acquis) peuvent aussi tout au long de la vie les moduler. 
Mais l’heredite c’est la part genetique au sens strict. 

La notion d’heritabilite fait reference precisement a l’estimation de 
cette part genetique en ce qu’elle peut expliquer les differences pheno- 
typiques constatees entre individus d’une meme population. L’herita- 
bilite evalue en quoi la variabilite genetique des individus constituant 
une population peut expliquer la variabilite phenotypique de ces memes 
individus. Plus la variabilite d’un trait phenotypique depend d’un large 
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spectre d’ instructions geniques (de genes) plus son heritabilite au regard 
de chacune des instructions geniques, sera consideree comme faible. 
A quoi s’ajoute egalement la part des facteurs environnementaux dans 
la variabilite phenotypique elle-meme. 

La relation entre genes et environnement 

Evaluer ce qui dans la formation d'u n organisme releve des parts respec- 
tives des genes et de 1’ environnement (l’inne et l’acquis, la nature et 
la culture) demeure une question centrale de la genetique. On sait 
aujourd’hui, dans ses grandes lignes quelles sont les bases moleculaires 
de l’inne. Les progres accomplis dans la connaissance de la structure des 
genomes et de leur fonctionnement commencent egalement a degager 
quelques pistes pour comprendre comment les facteurs de l’environ- 
nement agissent sur les genomes pour moduler leur expression et ajouter 
les multiples degres de liberte qui leur sont propres. Une nouvelle 
dimension de la genetique designee par le terme d’epigenetique se 
construit peu a peu. 

Des aspects deja anciens de la genetique se sont cependant efforces 
d’apprehender dans leur globalite et dans leur diversity, en s’appuyant 
essentiellement sur des approches mathematiques et statistiques les 
relations entre genes et environnement. II s’agit de ce qu’on appelle la 
genetique quantitative et la genetique des populations. 

La genetique quantitative 

La genetique quantitative etudie les caracteristiques biologiques (les 
traits phenotypiques) qui sont mesurables et quantifiables en essayant 
de reber la serie des valeurs constatees et leur distribution (la variabilite 
des phenotypes) aux mecanismes sous-jacents tels qu'ils sont admis par 
une majority de geneticiens se referent aux bases theoriques actuelles 
de leur discipline (la genetique mendelienne, voir cependant a ce sujet 
le concept controversy de gene, chapitre 1). 

La valeur phenotypique (P) d’un individu resulte de la combinaison 
d’une valeur genotypique (G) et d’un effet environnemental (E) : 

P = G + E. 

La valeur genotypique reunit toutes les instructions geniques ainsi 
que leurs interrelations. C’est pourquoi on subdivise habituellement le 
composant G en un composant A (addition cumulee des effets de 
chaque gene) et un composant D (effet resultant des interactions domi- 
nantes entre genes). L’ action de V environnement se subdivise en une 
composante E strictement environnementale et une composante I 
decrivant les interactions entre genes et environnement : 

P=A + D + E + I. 
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Ces differentes composantes ne sont pas determinees pour un seul 
individu mais pour des populations en evaluant les variances de 
chacune de ces populations : VP = VA + VD + VE + VI. 

En reference a la notion presentee plus haut on definit l'heritabilite 
au sens large d’un trait, soit H 2 comrne la part de la variance P (la 
variation phenotypique totale) due a la variance G (VA + VD). Frequem- 
ment le terme d’heritabilite (h 2 ) fait reference a la seule variance additive 
des genes (VA) intervenant dans la formation d’un trait. C’est en ce 
sens qu’on peut dire d’un gene ou d’un locus contenant une instruction 
genique et influengant le trait d’interet qu’il possede une faible ou une 
forte heritabilite. 

Dans 1’ estimation de ces variances il est essentiel de tenir compte 
des relations exactes de parente. Un pere et son tils partage 50 % de 
leurs genes tout comme la mere et le fils. Ce n’est pas par contre le cas 
du pere et de la mere dont les ascendants sont generalement differents. 
De fa?on similaire, deux soeurs ont en commun 50 % de leurs genes 
alors que deux demi-soeurs n’en partagent que 25 %. II est necessaire de 
tenir compte de ces differences parentales pour estimer la proportion 
de variance phenotypique totale attribuable a chaque composante de VP. 

S’appuyant sur 1’ analyse des genomes entiers, la genetique quanti- 
tative fait reference aujourd’hui a la notion de QTL. Determiner un 
QTL necessite done de combiner avec le plus de precision possible 
des mesures phenotypiques, genealogiques et genetiques sur un grand 
nombre d’individus. Son domaine d’action principal concerne done 
les traits variables qui sont determines par un nombre generalement 
assez eleve de genes (ou d’ instructions geniques). 

Parametres statistiques frequemment utilises 
en genetique quantitative 

Une classe inclut tous les individus presentant le rnerne phenotype 
pour un caractere precis. Dans une population, la moyenne x pour un 
caractere correspond a la somme de toutes les valeurs de ce caractere, 
soit (pci) divisee par le nombre de mesures effectuees (N) : 



A la valeur moyenne d’un caractere est attribute la valeur 0 en 
abscisse. Pour un individu donne, la valeur x de l’ecart a la moyenne 
est positive ou negative selon la valeur phenotypique de cet individu 
par rapport a la classe moyenne. 

La frequence relative^ exprime pour un caractere variable la propor- 
tion des individus (n ; ) appartenant a une classe (x a ) de ce caractere a 
tous les individus N analyses : 


Points clefs 
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f = - 

Jl N 

La variance (s 2 ) exprime 1’ amplitude de la dispersion des differentes 
classes d’individus (x, ou classes de caracteres) par rapport a la classe 
centrale, x : 


_ Yj( Xi ~x) 


N 

La variance s’exprime en unites au carre. L’ecart-type (s) de la 
distribution correspond a la racine carre de la variance. 

La covariance permet d’etablir si chez un individu deux caracteres, 
par exemple X et Y evoluent dans le meme sens. On a : 


cov 


_ 5^ (*,--*) ->o 


xy 


N 


Le coefficient de regression (b xy ) permet de determiner si la valeur 
pour un caractere (Y) depend de celle du caractere (X). C’est la pente 
de la droite Y =/(X), soit : 


b xy = 


cov xy 
s\x) ' 



POINTS CLEFS 


>• Pour survivre et se reproduce, les organismes vivants doivent repliquer 
fidelement leur ADN et le proteger des deteriorations physico-chimiques. 

>- Si I'ADN etait absolument invariant, c'est-a-dire replique avec une fidelite 
absolue et done depourvu totalement de mutations, il n'y aurait pas 
devolution des especes vivantes. 

>- Un taux eleve de mutations peut permettre a certains organismes d'evoluer 
et done de s'adapter plus rapidement a leur environnement. 

>- Les mutations, qu'elles soient spontanees ou provoquees par des deterio- 
rations liees au contexte environnemental, sont principalement dues a des 
erreurs de duplication de I'ADN, non corrigees. 

>- Contrairement aux idees predominantes en vogue apres la decouverte 
de sa structure, insistant sur le caractere invariant de I'ADN, on considere 
aujourd'hui la recombinaison et plus largement la mobilite et la plasticite 
de la sequence, comme des caracteristiques courantes et indispensables 
au fonctionnement et a la reproduction des etres vivants. Cette realite se 
manifeste particulierement a la meiose, notamment lors de I'echange de 
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fragments entiers de chromosomes, par recombinaison homologue, dans 
un processus connu sous le terme de « crossing over ». Elle est egalement 
illustree par les rearrangements et les deplacements de sequences connues 
sous le nom de transposition. 

>- Qu'elles soient geniques ou chromosomiques, les mutations ont de multiples 
formes ponctuelles (transitions, transversions) ou plus larges (amplifications, 
inversions, deletions, translocations, transpositions, recombinaisons diverses). 
Elies peuvent entrainer des pertes d'heterozygotie. Leurs effets se manifes- 
tent generalement par des modifications phenotypiques mais pas toujours. 
Elies peuvent etre favorables, defavorables ou neutres suivant le contexte 
environnemental et la selection qui prevaut. 

>- La selection est un processus biologique complexe a la base de 1'evolution 
des especes. II se deroule dans la nature (selection naturelle) mais peut 
aussi etre dirige a son profit par I'homme (selection artificielle). 

>- La selection naturelle aboutit a ce que les caracteristiques (traits pheno- 
typiques) favorables, transmises entre individus capables de se reproduire 
deviendront de plus en plus frequentes chez les descendants au cours des 
generations successives. Si les caracteristiques ainsi selectionnees ont une 
base genetique, le genotype correspondant deviendra egalement de plus 
en plus frequent dans les generations suivantes. 

>- La selection naturelle peut se manifester a divers stades du cycle vital d'un 
organisme ayant une reproduction sexuee. 

>- La selection naturelle de leurs caracteristiques phenotypiques assure aux 
individus porteurs une excellente adaptation au milieu dans lequel ils vivent 
(niche ecologique). Le maintien d'une telle selection basee sur un processus 
interactif entre genotype et milieu peut aboutir finalement a I'emergence 
d'une nouvelle espece. Cette idee simple repose sur le concept d'adaptation 
et demeure aujourd'hui encore a la base de la theorie de 1'evolution des 
especes vivantes, meme si celle-ci s'enrichit depuis les annees 1950, de 
nombreuses connaissances cellulaires et moleculaires. 

>- La selection est un processus qui en eliminant les mutations defavorables 
a une adaptation environnementale reduit la variability genetique apportee 
par les mutations. Dans le meme temps, de nouvelles mutations, aleatoires, 
se produisent qui realimentent la variability genetique au sein d'une 
population. Une balance, un equilibre s'etablit entre les deux processus 
(vitesse d'apparition des mutations et elimination des mutations defavo- 
rables). De cette balance resulte en quelque sorte la force propulsive de 
1'evolution. 

>- Le jeu complexe qui s'etablit entre phenotype, genotype et milieu est 
parfois represente par la relation : genotype + environnement + variation 
aleatoire h> phenotype. 


QCM-QROC 
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>- Quand les locus de deux genes (alleles) sont lies ou tres proches I'un de 
I'autre sur le meme chromosome, on dit qu'existe une liaison genetique. 

>- Le desequilibre de liaison decrit la situation qui dans une population resulte 
de certaines combinaisons d'alleles ou de marqueurs genetiques dont la 
frequence differe de celle qu'on attend d'une formation aleatoire d'haplo- 
types. Autrement dit, les associations non aleatoires entre genes (alleles) a 
differents loci sont mesurees par le deg re de desequilibre de liaison. 

>- Les instructions genetiques (I'inne) ne sont pas les seules causes des carac- 
teristiques biologiques d'un individu puisque Ton sait que des facteurs 
environnementaux (I'acquis) peuvent aussi tout au long de la vie les moduler. 
Mais I'heredite c'est la part genetique au sens strict. La notion d'heritabilite 
fait reference precisement a I'estimation de cette part genetique en ce 
qu'elle peut expliquer les differences phenotypiques constatees entre 
individus d'une meme population. 

>- La genetique quantitative etudie les caracteristiques biologiques (les traits 
phenotypiques) qui sont mesurables et quantifiables, en essayant de relier 
la serie des valeurs constatees et leur distribution (la variability des pheno- 
types) aux mecanismes sous-jacents tels qu'ils sont admis par une majorite 
de geneticiens se referant aux bases theoriques actuelles de leur discipline. 


QCM - QROC 

2.1 Qu’est-ce que I’heredite ? 

a) Le processus de transmission des caracteristiques biologiques d’un 
parent a sa descendance. 

b) Ce qui peut expliquer les differences phenotypiques constatees entre 
individus d’une meme population. 

c) Ce qui dans la formation d’un organisme releve des parts respectives 
des genes et de l’environnement. 

d) Ce qui appartient a i’inne et ce qui appartient a i’acquis. 

2.2 Qu’est-ce que la selection ? 

a) Un processus qui aboutit a ce que les caracteristiques (traits pheno- 
typiques) favorables, transmises entre individus capables de se repro- 
duire deviennent de plus en plus frequentes chez les descendants au 
cours des generations successives. 

b) Un processus qui aboutit a ce que la frequence d’un allele augmente 
parce que son adaptability sera plus grande que celle des autres alleles. 
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c) Un processus qui agit sur le potentiel de variation du genome et 
suivant les circonstances environnementales et l’echelle de temps 
consideree, peut ou non appauvrir la variability intrinseque du genome. 

2.3 Qu’entend-on par 1’ expression « desequilibre de liaison » : 

a) une distribution non aleatoire de marqueurs genetiques ? 

b) une distribution aleatoire de marqueurs genetiques ? 

c) une absence de marqueurs genetiques ? 

d) une abondance de marqueurs genetiques ? 

2.4 Citer deux aspects du processus reproductif d’une espece ou peut 
s’exercer la selection. 

2.5 Citer deux exemples de mutations a effet favorable chez l’homme. 

2.6 Citer deux deteriorations chimiques provoquant des mutations. 

2.7 Pourquoi une mutation provoquant un changement de cadre de 
lecture entraine-t-elle plus frequemment qu’une mutation « faux sens », 
la perte de fonction de la proteine correspondante ? 

2.8 Chez un couple sans antecedents familiaux nait un enfant de taille 
normale et un autre atteint de nanisme achondroplasique (arret du deve- 
loppement de certains os), un phenotype autosomal dominant, tres 
etroitement associe a un genotype mutant. Comment expliquer la 
naissance de cet enfant nain ? D’autres enfants de ce couple peuvent-ils 
etre atteints de ce type de nanisme. 


REPONSES 


2.1 a) 

2.2 a), b), c) 

2.3 a) 

2.4 Capacite a se reproduire (ne pas disparaitre avant d’etre capable 
de se reproduire), Competition sexuelle (competition entre adultes 
pour se reproduire), Nombre de descendants (et duree de la periode 
d’ aptitude a la reproduction), Fecondite croisee (fecondite relative male 
et femelle), Viabilite et selection des gametes (suivant les evenements 
de recombinaison meiotique), Compatibility des gametes (plus ou moins 
grande compatibility sperme-ovule). 


Reponses 
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2.5 Une mutation ponctuelle de la globine (un acide glutamique est 
substitue par la valine) responsable de l’anemie falciforme (l’agregation 
de l'hemoglobine deforme les hematies qui adoptent une forme en 
faucille et circulent mal). Les porteurs de cette mutation resistent a la 
malaria (paludisme), 1’ agent infectieux de cette maladie ( Plasmodium ) 
etant mal transport^. 

Une deletion de 32 bases dans le gene codant un recepteur de cyto- 
kines (CCR5), exprime preferentiellement dans les lymphocytes T, les 
macrophages et les cellules dendritiques. Ce recepteur, utilise par le 
VIH (virus du sida) comme corecepteur pour coloniser les lympho- 
cytes T, est non fonctionnel sous sa forme mutee (CCR5-A32) et confere 
aux porteurs homozygotes une resistance a l’infection par le VIH. 

2.6 L’hydrolyse spontanee de la liaison N-glycosidique unissant les 
bases puriques au desoxyribose cree des pseudo-nucleotides sans 
guanine ou adenine, dits apuriniques qui bloquent la replication. Si 
malgre tout une base est inseree en face de tels pseudo-nucleotides, il 
y a une chance sur quatre qu'elle soit erronee creant ainsi une mutation. 
L’hydrolyse spontanee des groupes NH 2 de la cytosine ou de la 5 -methyl- 
cytosine donne naissance respectivement a l’uracile et a la thymine. 
Elies s’apparieront alors apres un cycle de replication avec l’adenine 
et non plus avec la guanine creant ainsi une mutation ponctuelle par 
transition. La 7,8-dihydro-8-oxoguanine (oxoG) formee par certains 
radicaux libres oxy genes, s’apparie aussi bien avec la cytosine que 
L adenine, provoquant dans ce dernier cas une des mutations par trans- 
version les plus frequemment rencontrees a l’origine de certains cancers 
humains. 

2.7 Le changement de cadre de lecture resulte au minimum de la 
deletion ou de L addition d’une base (jamais de trois bases ou d’un 
multiple de trois). Du site de la mutation jusqu’a l’extremite de la 
proteine, la sequence en amino-acides s’en trouve modifiee, avec tres 
souvent aussi la possibility d’apparition d’un codon stop premature et 
la formation d’une proteine tronquee. La mutation « faux sens » 
change uniquement le sens du codon concerne et done un seul amino 
acide. 

2.8 L’ allele responsable de ce nanisme doit etre apparu spontanement 
dans la lignee germinale de l’un des parents. La survenue d’un autre 
enfant atteint de nanisme depend du stade auquel la mutation est 
intervenue (cellule souche de la lignee germinale ou gametes). Si les 
cellules souches (2 n chromosomes) de la lignee germinale de l’un 
des parents ont mute spontanement, la moitie des gametes (n chromo- 
somes) seront susceptibles d’etre porteurs et la probability de survenue 
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d’un autre enfant nain sera de 1/2. Elle sera nulle, si l’evenement de 
mutation initial est intervenu apres la meiose ayant produit les gametes 
porteurs. Elle sera comprise entre 0 et 0,5 selon la proportion de 
gametes atteints aux autres stades possibles de mutation. 


OBJECTIFS PLAN 


H Structure des genes 
etdes genomes 


3.1 La structure de I'ADN 

3.2 La structure et la fonction des chromosomes eucaryotes 

3.3 La structure des genomes 

> Analyser dans ses principaux aspects la structure en double helice de I'ADN 

> Analyser dans leurs principaux aspects la structure et la dynamique 
des nucleosomes et de la chromatine 

> Repertorier les principaux aspects de la structure et de I'organisation 
des differents genomes 


3.1 LA STRUCTURE DE L'ADN 
Nucleotides et polynucleotides 

La structure d'u n polynucleotide (polymere de nucleotides) repose 
sur la formation d’un nombre parfois eleve (plusieurs millions) de 
liaisons phosphodiester entre les nucleotides constitutifs (voir le Mini 
Manuel Biologie moleculaire). Chaque liaison phosphodiester s’etablit 
entre le groupe OH du carbone 3’ d’un pentose et le groupe OH porte 
par le carbone 5’ du pentose suivant. C’est la liaison phosphodiester 
3’-5\ II en resulte que 1’ orientation du polynucleotide se trouve definie 
par la position du groupe phosphate libre du premier nucleotide, 
generalement le phosphate porte par le carbone 5’, et par le groupe 
OH libre porte par le dernier nucleotide, generalement le phosphate 
porte par le carbone 3’. On dit ainsi que le polynucleotide est oriente 
dans le sens 5’ vers 3’. 

L’ADN est un acide nucleique bicatenaire, c’est-a-dire constitue 
de deux brins polynucleotidiques associes par des liaisons hydrogene 
entre les bases puriques et pyrimidiques constitutives des nucleotides. 
Les liaisons hydrogene s’etablissent toujours entre une purine de l’un 
des brins et une pyrimidine de 1’ autre brin. Dans cet appariement comple- 
mentaire, 1’ adenine (A) est done toujours associee a la thymine (T) 
par deux liaisons hydrogene et la guanine (G) interagit toujours avec 
la cytosine (C) grace a trois liaisons hydrogenes (Fig. 3.1). Ainsi, dans 
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Figure 3.1 Appariements complementaires des bases G-C et A-T. 


Tableau 3.1 Composition en bases de l'ADN de differentes origines. 


Originede l'ADN 

Bases (%) 

(A + T)/(G + C) 

(A + G)/(T + C) 

A 

G 

C 

T 

Bacteriophage T7 

26,0 

23,8 

23,6 

26,6 

1,11 

0,99 

Escherichia coli B 

23,8 

26,8 

26,6 

23,1 

0,88 

1,01 

Neurospora 

23,0 

27,1 

26,6 

23,3 

0,86 

1,00 

Drosophile 

30,7 

19,6 

20,2 

29,5 

1,51 

1,01 

Saumon 

28,0 

22,0 

20,0 

27,8 

1,33 

1,05 

Poule 

28,0 

22,0 

21,6 

28,4 

1,29 

1,00 

Rat 

28,6 

21,4 

21,6 

28,4 

1,33 

1,00 

Vache 

27,3 

22,5 

22,5 

27,7 

1,26 

0,99 

Homme 

29,3 

20,7 

20,0 

30,0 

1,46 

1,00 


3.1 • La structure del'ADN 


63 


Extremite 3' 

Extremite 5' 


H OH 



Extremite 5' 

Extremite 3' 


b) 


Extremite 5' 

(p) 

5 ' 


A 


5 ' 



HO 


Extremite 3' 


Extremite 3' 


HO 



Extremite 5' 


Figure 3.2 Structure des appariements complementaires de deux brins anti 
parallels d'ADN.a) representation developpee ;b) representation simplifiee. 
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I’ ADN, la quantite des purines (A + G) est egale a celle des pyrimidines 
(C + T). Par contre le rapport A + T sur G + C varie selon l’origine de 
I' ADN (Tableau 3.1 et voir le Mini Manuel Biologie moleculaire, 
Tableau 1.1). Le principe d’appariement complementaire des bases 
a une grande valeur pratique. 11 permet au geneticien de determiner la 
sequence nucleotidique d’un brin d’ADN a partir de celle du brin 
complementaire, qu'il s’agisse d’un brin ADN ou d’un transcrit ARN. 
L’ orientation d’un brin polynucleotidique est definie par la presence 
des groupes chimiques 5 ’-phosphate et 3 ’-OH portes par les carbones 
5’ et 3’ des deux desoxyriboses extremes (Fig. 3.2). Dans la double 
helice d’ADN, les deux brins complementaires sont orientes en sens 
inverse. On dit qu'ils sont antiparalleles. 

La double helice 

L’ association des deux brins par des liaisons hydrogenes provoque 
une contrainte physique qui impose a l’ensemble l’adoption d’une 
structure en double helice (Fig. 3.3). Dans le modele original, propose 
par James Watson et Francis Crick en 1953, la double helice a un 
diametre de 2 nm et presente deux periodicites. La premiere de 0,34 nm 
correspond a la distance separant deux plateaux de bases appariees. 
La seconde de 3,4 nm correspond au pas de l'helice qui couvre une 
longueur de 10,5 plateaux de bases (Fig. 3.3). A la surface de la molecule 


0,34 nm 


3,4 nm 


< 

2 nm 




Sens d’enroulement 


Figure 3.3 Representation d'un fragment d'ADN en double helice. 

A gauche, avec les plateaux de bases ; a droite, les atomes sont represents avec leurs 
rayons de Van der Waals. 
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b) 


o £ 

a ) c\3 




Figure 3.4 La dissociation de I'ADN et sa reassociation depend de sa teneur en G + C. 

a) Representation simplifiee du processus de dissociation-reassociation de I'ADN sous 
I'action d'agents denaturants; b) representation simplifiee de la courbe sigmoide, 
temoin du processus de dissociation. La formule etablit la relation entre la teneur en 
G + C de I'ADN et la temperature de fusion de I'ADN ; c) droite reliant la teneur en G + C 
et la Tm (Temperature de fusion) de divers organismes. 
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d’ADN, les deux brins torsades menagent deux sillons helicoi'daux 
de largeur differente, un sillon majeur ou grand sillon et un sillon mineur 
ou petit sillon (Fig. 3.3). Ces deux sillons, tout particulierement le 
grand sillon, exposent de nombreux groupes chimiques avec lesquels 
interagissent dans les conditions physiologiques de la cellule des 
proteines dites de liaison a l’ADN. Ces proteines assument des roles 
majeurs de regulation de l’expression de 1’ information genetique portee 
par la sequence en bases proprement dite. Sous sa forme bicatenaire 
(en double helice) l’ADN absorbe moderement la lumiere UV. Apres 
dissociation des deux brins, le demasquage des bases qui en resulte, 
provoque une absorption plus marquee de la lumiere UV. L’enregis- 
trement du phenomene a 260 nm fournit une courbe en forme de 
sigmoide, typique du phenomene (Fig. 3.4). La dissociation thermique 
de 1’ ADN et sa reassociation par refroidissement est une technique de 
base utilisee dans la reaction de polymerisation en chaine (PCR). 

Sous la forme lineaire souvent observee dans la plupart des cellules, 
les extremites de l’ADN sont libres et les contraintes physiques intro- 
duites par ses divers ligands sont, pour cette raison, facilement ajustees. 
L’ADN peut cependant exister sous une forme circulaire, c’est-a-dire 
sans extremites libres. C’est le cas de l’ADN bacterien, de beaucoup 
d’ADN viraux et de l’ADN mitochondrial (Tableau 3.2). C’est aussi 
le cas des plasmides, petits chromosomes bacteriens surnumeraires 
capables de s’autorepliquer de facon autonome. L’ADN circulaire 
subit des contraintes physiques qui ne sont reduites pour stabiliser 
l’ensemble que par un jeu de surenroulements parfois nombreux. Quel 
que soit l’ADN, l’orientation des genes depend pour chaque gene de 
l’orientation du brin effectivement transcrit (orientation 3’ — > 5’). Les 
deux brins peuvent etre porteurs de 1’ information transcrite (Fig. 3.5). 
Des chevauchements existent parfois entre genes dont 1’ orientation 
est opposee. 

Dans 1’ ADN de tres grande longueur des cellules eucaryotes, malgre 
la linearite de la molecule, les contraintes topologiques demeurent 
au sein de la chromatine. II est done important que ces contraintes 
soient reduites afin que les processus fondamentaux que sont la repli- 
cation et la transcription de 1’ ADN soient possibles. Une classe speciale 
d’enzymes, nominees topoisomerases, peut introduire des cassures 
specifiques dans l’un ou l’autre brin ou meme les deux. Ces cassures 
reduisent les contraintes, relachent les surenroulements et rendent 
possibles les processus physiologiques. Ceci est particulierement 
important lors de la separation des deux molecules d’ADN resultant 
de la replication, qui sont encore liees l’une a l’autre avant leur adressage 
aux deux cellules produites par la division cellulaire. 


3.1 • La structure del'ADN 


67 


Gene 1 Gene 2 Gene 3 Gene 4 


ADN 


5' 



C> 3 ' 


L 3 ' < i i / /=B37 y-i s 

5' > 3' 5' ) 3' 

Figure 3.5 Orientation des genes suivant que la sequence codante se trouve sur 
I'un ou I'autre brin de la double helice. 


Tableau 3.2 Genomes de divers organismes : 

STRUCTURE, TAILLE ET ESTIMATION DU NOMBRE DE GENES. 


Genome 


Groupe 


Structure 
du genome 


Taille (kb) 

Nombre 
de genes 

13 500 (L) 

6 000 

100 000 (L) 

13 500 

120 000 (L) 

25 000 

3.1 0 6 (L) 

28 000 


Eucaryotes : 

Saccharomyces Levures 
cerevisae 

Caenorhabditis Nematode 

elegans 

Arabidopsis Plante 

thaliana 

Homo sapiens Humain 


n_ 





r 









Procaryotes : 

Escherichia coli Bacterie 
Haemophilus Bacterie 
influenza 

Methanococcus Bacterie 
jannaschii 



4 700 (C) 

1 830 (L) 

4 000 

1 703 

1 660 (L) 

1 738 

172 (L/C) 

300 

229 (L) 

200 

78 (C) 

34 

17(C) 

37 

121 (C) 

136 


Virus : 

Virus T4 

HCMV (virus 
de I’herpes) 


Virus 

bacterien 

Virus 

eucaryote 



Organites 

Mitochondrie 
de S. cerevisae 
Mitochondrie 
de H. sapiens 
Chloroplaste 



□ Sequences repetees 

□ Introns 

□ Exons 


L : Lineaire 
C : Circulaire 
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3.2 LA STRUCTURE ET LA FONCTION 
DES CHROMOSOMES EUCARYOTES 

La structure du nudeosome 

Dans les cellules eucaryotes, a la difference des procaryotes, l’ADN 
est tres frequemment associe a des proteines basiques, les histones. 
Le resultat de 1’ assemblage regulier entre ADN et histones est designe 
par le terme de nudeosome (Fig. 3.6). 

La formation des nucleosomes est la premiere etape d’un processus 
qui assure l’empaquetage de l’ADN en structures compactes reduisant 
enormement le volume occupe par la molecule. L’ ensemble est designe 
sous le terme de chromatine. 


a) 



Octamere d’histones 



Nudeosome 



Figure 3.6 Structure simplifiee d'un nudeosome. 

a) I'octamere d'histones ; b) I'enroulement de I'ADN autour de I'octamere et sa solidifi- 
cation par I'histone HI ; c) protuberance vers I'exterieur des queues N-terminales 
d'histones de I'octamere. 


Chacune des classes d'histones est constitute de petites proteines 
riches en amino-acides charges positivement (lysine et arginine). Leurs 
sequences en amino-acides sont restees remarquablement identiques 
au cours de 1’ evolution. Les histones H2A, H2B, H3 et H4 (11 a 15 kd) 
sont en quantite egale et chacune en double exemplaire, elles forment 
un octamere d'histones (Fig. 3.6 a) constituant un « coeur » proteique 
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discoide de 8 proteines autour duquel l’ADN nucleosomal d’une 
taille de 147 paires de bases est enroule (Fig. 3.6b). L’histone HI (20 kd) 
ne fait pas partie du « coeur ». Elle est attachee d’une part, a 1’ ADN de 
liaison situe entre les nucleosomes et, d’autre part, a l’ADN nucleo- 
somal ce qui a pour effet de solidifier 1’ ensemble (Fig. 3.6 et 3.7). 


Nucleosome 



Histone HI 




Figure 3.7 Representation simplifiee d'un enchainement de trois nucleosomes 
montrant le role de I'histone HI dans le resserrement de I'ADN autour de I'octa- 
mere d'histones. 

De nombreux contacts existent entre les histones de l’octamere et 
I'ADN nucleosomal. Ils sont independants de la sequence en bases de 
I’ADN, ce qui explique que la presque totalite de I’ADN des cellules 
eucaryotes est organisee en nucleosomes. Les histones du cceur 
possedent des extremites libres du cote N, designees par le terme de 
« queues ». Ces queues emergent du nucleosome en des positions tres 
precises (Fig. 3.6 c). Elies facilitent la formation des structures d’ordre 
superieur resultant des surenroulements de nucleosomes donnant la 
structure finale de la chromatine (Fig. 3.8). Certains amino-acides des 
queues d’histones sont parfois modifies par des groupes acetyle et 
methyle (lysine, arginine) ou phosphate (serine). Ces modifications 
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Double helice d'ADN 
(2 nm) 


Nucleosomes formant 
une structure en 
« collier de perles » 



Fibre compactee de 
chromatine de 30 nm 
de diametre. 
Structure en solenoide 
(6 nucleosomes/tour) 




Chromosome 
metaphasique condense 
(1 400 nm) 


Figure 3.8 Modele hypothetique de I'organisation et de la compaction de la 
chromatine. 
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facilitent ou alterent 1’ accessibility de la chromatine. Elies constitue- 
raient un « code epigenetique » qui pourrait etre lu par les proteines 
impliquees dans la regulation de l’expression des genes et dans les 
diverses autres fonctions de I' ADN. Les nucleosomes sont des structures 
dynamiques, constamment modifiees par de nombreux complexes 
proteiques de remodelage capables de les deplacer le long de la molecule 
d’ADN, de les transferer d’une molecule d’ADN a une autre ou de les 
modifier afin d’accroitre 1’ accessibility de l’ADN. 

La structure et le remodelage de la chromatine 

La presence de V histone HI solidifie et resserre la structure du nucleo- 
some. L’ADN nucleosomal represente alors 160 pb. L’ histone HI 
favorise aussi la formation de structure d’ordre superieur. Les nucleo- 
somes s’organisent alors en une fibre de 30 nm de diametre qui est en 
fait une super-helice comportant 6 nucleosomes par tour. Ceci ne 
suffit pas cependant pour empaqueter les 1 a 2 metres d’ADN dans un 
noyau cellulaire de 10 5 metre environ de diametre. Des repliements 
en forme de boucles de la fibre de 30 nm sont done necessaries. Les 
boucles seraient maintenues dans un ensemble compact par leur asso- 
ciation a un support proteique, une sorte d’echafaudage proteique 
nucleaire a vrai dire encore un peu mysterieux (Fig. 3.8). Lorsque les 
structures d’ordre superieur predominent, cela a pour effet de reduire 
fortement 1’ accessibility de l’ADN aux enzymes et autres proteines 
necessaires a la transcription. A l’inverse, le remodelage strictement 
controle de la chromatine par des complexes proteiques specialises 
est une condition absolue de l’expression genique. 

La structure des chromosomes au cours du cycle cellulaire 

Dans les cellules eucaryotes, le chromosome est le stade superieur 
et ultime d’ organisation de l’ADN (voir Fig. 3.8). Le nombre de 
chromosomes et leur composition sont des caracteristiques de chaque 
organisme. 

Le sequen^age complet d’un certain nombre de genomes a montre 
que la quantity d’ADN effectivement utilise pour coder les proteines 
ou les ARN varie enormement d’un organisme a un autre. Chez les 
bacteries, la presque totality de l’ADN code des proteines. Chez les 
mammiferes, seule une petite portion (moins de 10 %) code reellement 
les proteines ou les divers ARN, le reste ou ADN intergenique, est 
constitue largement de sequences repetees (souvent des dinucleotides), 
appelees microsatellites (3 %) ou composees de grands elements de 
sequences transposables (plus de 50 %). Beaucoup d’ interrogations 
demeurent encore aujourd’hui sur les fonctions exactes de l’ADN 
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intergenique, dont l’apparente inutilite semble contredite par sa neces- 
saire et exacte duplication a chaque division cellulaire. 

Pour etre maintenu comme tels au cours de la division cellulaire, 
chaque chromosome doit posseder un centromere, des telomeres et 
plusieurs origines de replication. Les origines de replication sont les 
nombreux sites (3000 par chromosome en moyenne) ou s’assemblent 
les divers composants proteiques, dont les ADN polymerases, neces- 
saires au demarrage de la replication (duplication de 1’ ADN) operation 
qui precede la division cellulaire. Les centromeres sont des sequences 
d’une taille superieure a 40 kb au contact desquelles se construit le 
kinetochore, un complexe proteique necessaire a la separation et 
I'adressage corrects des deux chromosomes-fils aux deux cellules hlles. 

11 est essentiel qu’un seul centromere soit present par chromosome. 
Dans le cas contraire, il en resulte des cassures, des pertes ou des 
duplications de chromosomes dont les consequences sont generalement 
graves. 

Les telomeres sont des sequences particulieres localisees aux deux 
extremites du chromosome. Elies sont reconnues par des proteines 
specifiques qui protegent le chromosome des evenements de recombi- 
naison ou de degradation typiques des extremites ADN libres. A 
l’endroit des telomeres se trouve une origine de replication particuliere 
reconnue par une ADN polymerase speciale, la telomerase, qui 
replique un certain nombre de fois la sequence correspondante. 

La duplication du chromosome puis sa segregation s’opere dans des 
phases distinctes du cycle cellulaire (division cellulaire ou mitose). 
On distingue dans l’ordre 4 phases : Gl, S, G2 et M (Fig. 3.9). 

Au cours de la phase S s’opere la synthese de l’ADN conduisant a 
la duplication des chromosomes en deux chromatides sceurs mainte- 
nues ensemble par un complexe proteique appele cohesine, jusqu’a la 
segregation. 

Celle-ci s’opere durant la phase M (pour mitose). Chaque chromatide 
s’ attache grace au kinetochore a un fuseau mitotique fait de proteines 
fibreuses appelees microtubules reunies a deux poles opposes organises, 
nommes centrosomes. La cohesine en se desagregeant favorise la 
separation des deux chromatides sceurs. L’ ensemble des operations 
est soigneusement coordonne afin que la separation et i’adressage 
assurent un transfert complet et efficace des informations genetiques 
portees par les deux chromosomes-fils. 

Les phases Gl et G2 (G pour gap) sont des phases d’attente et de 
preparation des phases suivantes. Des mecanismes de controle du 
cycle operent pendant ces phases qui autoriseront ou non sa poursuite 
jusqu’a son terme. 
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Figure 3.9 Chromosomes et cycle cellulaire. 

a) Duplication et segregation des chromosomes au cours du cycle cellulaire. b) Variation 
de la quantite d'ADN « Q » au niveau des chromosomes a un instant f dans la cellule. 


Au cours du processus complet de la division cellulaire, l'etat de 
condensation des chromosomes varie profondement. Durant les phases 
Gl, S et G2 (groupees sous le terme d’interphase) il est plus faible 
que durant la phase M bien que des changements discrets se produisent 
constamment. 
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3.3 LA STRUCTURE DES GENOMES 
Qu'est-ce qu'un genome ? 

On designe par le terme de genome (contraction des mots gene et 
chromosome) l’ensemble des informations genetiques, codees par 
l’ADN chez la plupart des organismes et parfois par l’ARN pour 
certains virus et qui sont hereditairement transmissibles. De fa?on 
plus precise, le terme designe la sequence de 1’ ADN correspondant a un 
jeu haploide de chromosomes (n chromosomes). Une cellule somatique 
humaine, diploide (2 n chromosomes), contient done deux genomes 
(un genome paternel et un genome maternel) alors qu’une cellule 
germinale (sexuelle), haploide (ovule ou spermatozoide), en contient 
un seul. Le terme genome s’applique aussi bien a l’ADN du noyau 
cellulaire (genome nucleaire) qu’a l’ADN des organites (genome 
mitochondrial, genome chloroplastique). Parler du sequengage du 
genome d’une espece signifie que l’ordre des nucleotides constituant 
l’ADN du jeu haploide des chromosomes non sexuels (autosomes) et 
sexuels - male et femelle - est etabli ou en cours de l’etre. On parle de 
genomique (contraction des mots genome et informative) pour 
designer l’etude a grande echelle des proprietes generates des genomes 
grace a des moyens informatiques de plus en plus puissants. Les 
premieres questions interessant l’etude des genomes portent sur leur 
taille, le nombre de genes qu'ils contiennent (au sens classique du 
concept), le nombre de chromosomes constitutifs et la maniere dont 
les genes sont distribues ou organises. 

La taille des genomes 

Pour designer la taille d’un genome on utilise habituellement une unite 
exprimant le nombre de paires de nucleotides. Pour le millier de paires 
de nucleotides ou de bases soit 10 3 , l’unite est la kilopaire de bases 
ou Kpb, pour le million soit 10 6 , 1’ unite est la megapaire de bases ou 
Mpb. On pense generalement qu'il existerait une relation progressive 
entre la taille des genomes, le nombre de genes qu’ils contiennent et la 
complexity des groupes d’organismes vivants (Fig. 3.10 et Tableau 3.2). 
En verite, plus la connaissance intime de la structure et du fonction- 
nement des genomes progresse plus cette relation s’avere improbable. 
D’une part, la notion meme de « complexity » n’est pas tres operation- 
nelle (une plante a fleurs ou une grenouille sont-elles plus complexes 
qu’un humain ?) ; d’autre part, l’organisation des instructions genetiques 
au sein des genomes et surtout leur mode d’ expression semblent a la 
fois tres diversifies et variables selon les organismes. 
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Figure 3.10 Quantite d'ADN present dans les genomes de differents groupes 
d'organismes. 

Les genomes viraux 

Bien que les virus ne soient pas consideres comme des organismes 
vivants mais comme des parasites moleculaires, ils se reproduisent en 
infectant des cellules vivantes dans lesquelles ils injectent leur genome 
constitue par de l’ADN double brins ou parfois simple brin, protege 
au sein d’une particule ou capside de nature proteique. Certains virus, 
comme les retrovirus auxquels se rattache par exemple le VIH, ont un 
genome constitue d’ARN, qui se presente soit sous la forme d’un seul 
brin ou d’un double brin. Quel que soit l’acide nucleique, il est pour 
certains virus, sous une forme lineaire et pour d’autres, sous une forme 
circulaire. Dans tous les cas, le genome viral existe au moins dans une 
des phases de son cycle cellulaire sous la forme d’un ADN double brins. 

Les genomes procaryotes 

Le genome de la plupart des organismes procaryotes correspond a un 
seul chromosome compose d’un ADN souvent circulaire et de tres 
peu de proteines associees. Une bacterie en cours de division peut 
cependant contenir simultanement plusieurs copies de ce chromosome 
unique. Les genes bacteriens sont tres proches les uns des autres avec 
peu d’espaces intergeniques, souvent organises en unites, les operons, 
transcrits en un seul ARN messager (voir le Mini Manuel, Biologie 
moleculaire). L’ADN associe a quelques proteines forme une masse 
dense, le nucleoide qui se desorganise en un echeveau filamenteux 
lorsque la cellule est broyee. 
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Les genomes eucaryotes 

Les especes eucaryotes sont soit diploides (les cellules somatiques 
des animaux et plantes a fleurs possedent dans leur noyau, deux jeux 
- 2 n - de chromosomes) ou haploides (un seul jeu - n - de chromo- 
somes par noyau cellulaire chez la plupart des champignons et les 
algues). Les organismes diploides produisent generalement des cellules 
specialisees haploides (n chromosomes) pour la reproduction 
(ovule et spermatozoide chez les animaux) alors que les organismes 
haploides peuvent presenter au cours de la phase sexuee de leur cycle 
vital des cellules specialisees a 2 n chromosomes. Le nombre n de 
chromosomes presents dans les cellules d’un organisme definit le 
niveau de ploidie. Les vegetaux presentent souvent des niveaux de 
ploi'die eleves (polyploidie). Dans une cellule diploide, les chromo- 
somes s’associent en paires de chromosomes homologues, chaque 
chromosome possedant une taille et un nombre de genes identiques aux 
memes positions. Cependant une paire de chromosomes peut porter 
deux alleles differents d'un meme gene (voir plus haut). Le terme de 
caryotype est utilise pour designer le nombre de chromosomes, etabli 
par Lobservation microscopique d’une cellule en metaphase. 

Au sein d’une espece, les chromosomes peuvent differer fortement 
en taille. Chez 1’homme (Tableau 3.3) les cluomosomes 1 et 2 ont une 
grande taille alors que les chromosomes 21 et 22 sont quatre fois plus 


Tableau 3.3 Principales caracteristiques des chromosomes humains. 


Grands 

chromosomes 

Chromosomes 

moyens 

Petits Chromosomes 

chromosomes sexuels 

A B 

C D 

E F G C G 


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y 



8,4 8,0 6,8 6,3 6,1 5,9 5,4 4,9 4.8 4,6 4,6 4,7 3,7 3,6 3,5 3,4 3,3 2,9 2,7 2,6 1,9 2,0 5,1 2,2 


Longueur relative des chromosomes (%) 
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petits. Pour mieux les analyser, le cytogeneticien classe les chromo- 
somes d’un organisme suivant leur appartenance a un groupe de taille 
(de A a G chez I'homme). La position du centromere (voir plus haut) 
qui apparait souvent sous la forme d’une constriction chez le chromo- 
some metaphasique, divise le chromosome en deux bras. Le plus court 
est appele p et le plus long q. Le cytogeneticien utilise cette nomen- 
clature pour donner la position d’un gene sur les bras d’un chromosome. 
On dit d’un chromosome qu’il est telocentrique si le centromere est 
situe a une extremite, acrocentrique s’il est proche d’une extremite et 
metacentrique s’il est situe vers le milieu. 

Les genomes d'organites 

A cote des chromosomes nucleaires qui represented l’essentiel du 
genome d’un organisme eucaryote, certains organites (essentiellement 
les mitochondries et les chloroplastes, presents parfois en grand nombre 
dans une cellule) possedent des chromosomes sous la forme de petites 
molecules d’ADN circulaires, d’une taille moyenne avoisinant 10 4 a 
10 5 paires de bases, souvent en de nombreuses copies identiques. 
Pour ces raisons, il arrive que selon les organismes, le nombre de 
chromosomes d’organites par cellule s’avere tres eleve jusqu’a plusieurs 
centaines parfois. En general, les chromosomes d’organites possedent 
des genes (de l’ordre de 50 a 100), certains avec des introns. Ces 
genes sont specifiques des fonctions assurees par l’organite lui-meme. 
Mais beaucoup des fonctions de l’organite sont specifiees cependant 
par des genes nucleaires sans qu’il y ait de redondance entre les genes 
des deux compartiments, mais plutot une complementarite. Selon la 
theorie endosymbiotique relative a l’origine des cellules eucaryotes, 
mitochondries et chloroplastes seraient d’anciennes bacteries ayant 
colonise une cellule hote elle-meme descendante de la premiere cellule 
vivante (voir le Mini Manuel Biologie cellulaire dans cette serie). Au 
cours de 1’evolution, beaucoup des genes de ces bacteries ancestrales 
symbiotes ont ete transferes dans les chromosomes nucleaires de 
l’hote ou parfois tout simplement perdus. II n’en demeure pas moins 
que les benefices de la symbiose sont suffisamment forts pour que ces 
organites aient ete conserves au cours de 1’evolution. 

3.4 LE SEQUEN^AGE DES GENOMES 

Puisque les instructions qui gouvement la formation et le fonctionnement 
des etres vivants sont contenues dans la sequence de la molecule 
d’ADN, presente au coeur de toutes les cellules vivantes, il est apparu 
tres tot, apres la decouverte du code genetique dans les annees 1960, 
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que la connaissance precise de la sequence specifique de chaque espece 
vivante, constituerait un pas decisif vers le decryptage de questions 
aussi capitales que celles de l’origine et de 1’ evolution du vivant. Des 
pionniers s’illustrerent dans la mise au point des methodes de sequen- 
gage (le principe du sequengage est presente dans le Mini Manuel 
Biologie moleculaire), mais il fallut attendre la mise au point de 
machines performantes et les progres de l’informatique pour que les 
premieres sequences soient etablies. 

Fragmenter puis assembler 

Les debuts furent modestes. En 1976, la sequence du tout petit genome 
du bacteriophage MS2 fut etablie, suivie en 1977 de la sequence du 
phage <J>X174. C’est a cette occasion que commenga a etre resolue la 
question centrale encore presente aujourd'hui pour toute demarche de 
sequengage. Pour sequencer des molecules d’ADN composees d’un 
alignement de millions ou de milliards de nucleotides, il s’avere 
indispensable de fragmenter au prealable la molecule. Mais cette 
operation fait disparaitre V information de sequence qui est precisement 
capitale pour l’exploitation des resultats. La solution de cette diffi- 
culte est venue de l’utilisation d’algorithmes informatiques capables 
de combiner les informations de sequence et de reconstituer a partir 
de petits fragments d’ADN (environ 500 pb), facilement sequengables, 
la sequence complete d’un genome de grande taille. Cette technique 
dite du « shotgun » connue un grand succes et fut appliquee, a partir 
des annees 1990, pour les tres grands genomes comme celui de 
l’homme, grace aux progres de l’automatisation du sequengage et des 
logiciels d’ assemblage informatique. Les fragments assembles en 
plus grandes regions genomiques par cette methode sont denommes 
« contigs ». Ce terme particulier rappelle qu'il s’agissait bien de 
reconstituer par 1’ assemblage de fragments contigus, la continuite de 
la sequence d’origine. De fag on alternative, le developpement des 
techniques de clonage moleculaire ont permis d’obtenir de grandes 
quantites de chacun des fragments engendres par coupure enzymatique 
a l’aide d’endonucleases de restriction ou par cisaillement physique. 
Des banques furent ainsi constitutes a partir desquelles le sequencage 
des fragments pouvait etre organise et repete autant de fois qu’il le 
fallait afin de securiser les resultats (Fig. 3.11 et 3.12). 
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Chromosome 



Figure 3.11 Construction et exploitation d'une banque de fragments d'ADN clones. 

L'ADN du chromosome, obtenu Iui-meme par tri chromosomique en cytometrie de 
flux est prealablement extrait puis fragments par des enzymes de restriction. Plusieurs 
categories d'enzymes de restriction sont employees afin d'obtenir plusieurs types de 
fragments de restriction pour une meme sequence. Tous les fragments obtenus sont 
clones et mis en culture dans des boites speciales a multiples puits de culture afin de 
constituer la banque de reference. Chaque clone est ensuite identifie soit par sa carte 
de restriction, soit par le sequence de ses extremites puis les clones sont apparies et 
ordonnes en contigs en exploitant les chevauchements de sequences qui leur sont 
communes. Les differents fragments constituant les contigs peuvent etre sequences 
entierement et la sequence complete de I'ADN du chromosome sera reconstitute par 
un assemblage realisant a I'aide de I'informatique des contigs de contigs. La methode 
dite du « shotgun » consiste a fragmenter en morceaux de tres petite taille I'ADN chromo- 
somique, a cloner les fragments puis a les sequencer directement, I'assemblage des 
sequences obtenues s'operant par le biais de I'informatique pourvu que la puissance des 
logiciels soit suffisante pour traiter simultanement des millions d'informations unitaires. 
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Figure 3.12 Recapitulation des operations successives necessaires a I'obtention 
de la sequence complete de I'ADN d'un chromosome. 

On notera id le passage par des BACs (chromosome bacterien artificiel contenant des 
fragment de I'ADN a sequencer d'assez grande taille allant de 4. 1 0 4 a 3.1 0 5 ) ce qui 
facilite la construction de contigs de grande taille et ameliore le rendement general de 
I'operation de sequence de chaque chromosome. 


Le sequengage du genome humain 

Ces techniques furent appliquees au sequencage du genome humain 
dont le projet fut considere par les autorites internationales comme 
relevant du franchissement d’une nouvelle frontiere de l'humanite. 
Son cout fut evalue a 3 milliards $ (2,25 milliards €). Ce sequengage a 
ete realise concurremment par plusieurs equipes organisees autour 
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d’un consortium public reunissant plusieurs institutions de differents 
pays sous la conduite du National Human Genome Research Institut 
americain dirige par Francis Collins et par une entreprise privee 
americaine (Celera Genomics) dirigee par Craig Venter. Les premiers 
utiliserent principalement la technique basee sur l’organisation de 
contigs de BAC (Chromosome artificiel bacterien contenant un 
fragment aleatoire du genome humain, voir Fig. 3.12), preservant ainsi 
au maximum l’ordonnancement de la sequence. Les seconds appli- 
querent a ce grand genome la technique de la fragmentation aleatoire 
dite du « shotgun ». L’essentiel de la sequence (92 %), constitute 
d’ environ 3 milliards de paires de bases, fut obtenue et publiee conjoin- 
tement en 2003. Les 8 % restants correspondent a des regions hautement 
repetees (centromeres et telomeres) ainsi qu’a des regions contenant 
des families multigeniques dont on ne sait pas encore si elles pourront 
reellement un jour etre entierement sequencees. 

Le postsequencage 

L’un des objectifs du projet de sequengage du genome consistait 
egalement a identifier au sein de cet ensemble enorme de donnees, 
celles qui definissent les genes au sens classique du concept (les 
sequences codant des proteines). Cet aspect du projet reste encore 
ouvert (Fig. 3.13). Le nombre total de genes n’est pas encore etabli 
avec precision. II se situerait autour de 25 000, soit beaucoup moins 
que ce qui etait attendu (environ 200000) sur la base d’un raisonnement, 
qui s’est revele faux, liant le nombre de genes a la complexity 
supposee de Lorganisme etudie. 

Un autre objectif du projet consistait a developper les methodes de 
sequen^age afin de progresser vers l’application de methodes pennettant 
de deboucher sur une exploitation industrielle assurant des applications 
systematiques et a faible cout dans le domaine de la sante notamment 
(voir plus loin et chapitre 5.6). 

La sequence etablie de l’ADN humain est aujourd’hui deposee 
dans les banques de donnees et elle est accessible pour tous par 
Internet. Un travail intense d’ annotation destine a comprendre comment 
fonctionnent les instructions contenues dans la sequence a ete entrepris. 
II s’annonce long et complexe car il depend en grande partie de 
connaissances qui restent encore a acquerir (ou a conquerir) sur la nature 
exacte de ces instructions et sur leur mode d’expression (voir chapitre 1 
« Qu’est-ce qu’un gene ? »). 
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Figure 3.13 Differents types de sequences au sein du genome humain. 

La majorite des sequences ne codent pas des proteines. Seules 1,5 % des sequences 
soit 48 megabases sur 3 200 pour le genome complet, correspondent a des exons au 
sein de genes codants. 


Chaque personne humaine possede une sequence ADN unique, 
c’est-a-dire qui lui est propre. La sequence publiee par le consortium 
international correspond a la sequence combinee d'un petit nombre 
de donneurs anonymes et n’est done pas exactement la sequence 
exploitable pour chacun d’entre nous. L’un des projets d’avenir 
consistera a developper la puissance des techniques de sequencage 
afin de pouvoir etablir pour chaque personne et a faible cout l’exacte 
sequence de son ADN. On estime aujourd’hui qu’en moyenne l’ADN 
de deux humains pris au hasard differerait de 10 6 a 10 7 paires de bases 
dont une grande partie se presente sous la forme de SNP (Single 
Nucleotide Polymorphism). Ce polymorphisme moleculaire constitue 
Pune des bases « chimiques » des differences phenotypiques de tous 
ordres qui sont observables entre les personnes (voir chapitre 5.6). 
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Vers la sequence pour tous 

Sera-t-il possible d’atteindre cet objectif dans un delai de temps 
raisonnable et a quel cout ? Le sequengage du genome humain a coute 
pres de 3 milliards de dollars et a mobilise, durant pres de 1 1 ans, plus 
de 1 000 chercheurs du monde entier. Aux technologies de type 
« Sanger » (decrites au chapitre 6 du Mini Manuel de Biologie Mole- 
culaire) se sont substitutes des technologies de plus en plus sophisti- 
quees et de plus en plus miniaturisees de sorte qu’aujourd’hui il 
devient possible de realiser le resequengage d’un genome complet en 
a peine quelques jours, bientot en quelques heures. Le principe de ces 
technologies a haut debit consiste a amplifier de courtes sequences de 
quelques dizaines de bases dans des volumes reactionnels extreme- 
ment reduits afin de generer des millions de tres courtes sequences 
d’ADN amplifiees qui sont ensuite sequencees individuellement. Ces 
courtes sequences sont ensuite reordonnees grace a des outils bio- 
informatiques de plus en plus performants qui les comparent a une 
sequence de reference. 

Le cout de ce resequengage evolue egalement de maniere verti- 
gineuse : des octobre 2006, la fondation americaine X Prize Foun- 
dation a annonce un prix de 10 millions de dollars pour la 
premiere entreprise capable de sequencer un genome complet pour 
moins de 1 000 $ ! Cet objectif sera probablement atteint a court 
terme et certaines societes de biotechnologies annoncent deja 
avoir trouve des solutions pour reduire les couts resequengage a 
moins de 100 $. 

Ces nouvelles technologies de resequengage ouvrent des perspec- 
tives revolutionnaires en matiere de recherche ( Tableau 3.4). II devient 
par exemple possible de connaitre precisement les alterations du 
genome d’une seule cellule cancereuse, d’analyser simultanement les 
genes exprimes par 1’ ensemble des microorganismes d’un milieu donne 
(cette approche est appelee « metagenomique ») ou encore d’ amplifier 
et de resequencer specifiquement des sequences genomiques ciblees de 
plusieurs megabases. 

En peu de temps, la democratisation des technologies de sequen- 
gage a haut-debit, rendue possible par une reduction tres importante 
des couts de sequengage, a foumi a de nombreux champs d’investi- 
gation, de nouveaux outils d’ analyse particulierement puissants, agissant 
comme un accelerateur de recherches. 
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Tableau 3.4 Exemples d'applications des technologies de sequence a haut-debit. 


Application 

Exemple 

Resequence complet 
de genome 

Recherche de polymorphismes a I'echelle du genome entre 

2 individus, recherche de nouvelles mutations, analyse fine 
de genes. 

Sequence denovo 

Alignement de sequences issues des technologies de 
sequence sans utiliser de genome de reference. Cette 
approche reste encore problematique, notamment a cause 
du grand nombre de sequences repetees mais a ete utilisee 
avec succes pour sequencer certains genomes bacteriens. 

II s'agit d'un enjeu majeur pour les prochaines annees. 

Resequence de 

regions ciblees 

Identification de nouveaux polymorphismes 
ou de mutations causales. 

Metagenomique 

Identification d'une flore bacterienne ou virale au sein 
d'une niche environnementale particuliere ;analyse globale 
des voies metaboliques et de I'expression des genes d'une 
population microbienne particuliere (ex : analyse du micro- 
biome). 

Sequence 

du transcriptome 

Analyse de I'expression des genes a I'echelle du genome, 
identification de transcrits rares. 

Sequence des petits 

ARNs 

Identification par sequence de petits ARN de type micro 
ARN et ARN non codants (ARN transcrit mais non traduit en 
proteines). 

Sequence apres 

immunoprecipitation de 
la chromatine (ChiP-Seq) 

Cartographies I'echelle du genome, des sites d'interaction 
entre I'ADN et les proteines regulant I'expression des genes. 

Code-barre moleculaire 

Sequence simultanes de plusieurs individus, chaque 
echantillon multiplexe etant repere par une sequence 
d'ADN unique constituant un code-barre moleculaire. 

Sequence 

de genomes anciens 

Reconstitution et analyse de genomes anciens d'especes 
disparues a partir d'ADN nucleaire, meme degrade (ex : 
genome du Mammouth, Homme de Neandertal). 

Sequence denovo 

Alignement de sequences issues des technologies de 
sequence sans utiliser de genome de reference. Cette 
approche reste encore problematique, notamment a cause 
du grand nombre de sequences repetees mais a ete utilisee 
avec succes pour sequencer certains genomes bacteriens. 

II s'agit d'un enjeu majeur pour les prochaines annees. 
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line carte d'identite genetique 

Avec la baisse du cout du decryptage d’un genome, de plus en plus de 
genomes entierement sequences seront disponibles pour les cher- 
cheurs. Les retombees attendues sont considerables, notamment dans 
le domaine de la sante humaine. 

11 est probable qu’a l’avenir, chacun disposera de son propre 
genome et de l’information genetique qu'il contient. Un patient 
pourra ainsi connaitre ses predispositions a developper certains types 
de cancer, ou encore recevoir un traitement personnalise de sa 
maladie en fonction de ses propres caracteristiques genetiques : c’est 
l’ere de la « genomique personnelle ». 

La recherche de caracteristiques moleculaires permettant de deter- 
miner si un individu est porteur d’une mutation responsable d’une 
maladie genetique est depuis longtemps l’objectif de nombreuses 
equipes de recherche. On trouvera ci-apres (Fig. 3.14 et 3.15) deux 
exemples simples d’utilisation des sequences repetees de type micro- 
satellites permettant de reperer des mutations genetiques. 

Avec l’arrivee des technologies de genotypage a haut debit et 
bientot grace a la democratisation des outils de sequenqages a haut 
debit, certaines societes se sont specialises dans le depistage de la 
susceptibility a certaines maladies genetiques en exploitant la variabi- 
lity du genome. Ainsi, il est d’ores et deja possible, contre quelques 
centaines de dollars et un prelevement de salive, de connaitre le risque 
(relatif) de developper des maladies comme la maladie d’Alzheimer, 
l’asthme, le cancer du sein, de la prostate ou de colon, la maladie de 
Crohn, l’intolerance au lactose, la sclerose en plaque, l’infarctus du 
myocarde, l’obesite, le psoriasis, la polyarthrite rhumatoide ou encore 
les diabetes type 1 et type 2 ! 

Si dans certains cas medicaux, par exemple lorsqu'une atteinte 
familiale est suspectee, ce genre de service peut s’averer particuliere- 
ment interessant, il convient de rester prudent face aux derives ethi- 
ques qui peuvent accompagner ce genre de services. En effet, sans 
compter Leffet catastrophique que pourrait avoir ce genre de revela- 
tions sans accompagnement medical et psychologique, il est impor- 
tant que ces informations restent personnelles et ne puissent etre 
transmises a des tiers ou etre utilisees commercialement... On 
imagine aisement l’interet de certains assureurs a disposer d’ informa- 
tions sur les risques cardio-vasculaires d’un client venant souscrire un 
credit. . . 
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Gel de polyacrylamide 

Figure 3.14 Analyse du polymorphisme d'un microsatellite. 

Le microsatellite (courte sequence d'ADN repete) est ici constitue d'une repetition 
variable (de 20 a 24) de dinucleotides GT (CA sur le brin complementaire). Dans les 
regions flanquantes du microsatellite, des amorces PCR ont ete choisies pour realiser 
un test d'amplification. Le schema represente 4 variants en longueur (taille), qui sont 
autant d'alleles differents du microsatellite. Ils sont identifies par leur distance de 
migration en gel de polyacrylamide. Pour qu'un locus microsatellite soit informatif, son 
polymorphisme ne doit pas etre inferieur a 1 2 repetitions du motif nucleotidique. A un 
locus donne, un individu portera pour chaque paire de chromosomes homologues, 
I'un ou I'autre des variants du microsatellite. Dans une population, a un locus donne et 
pour un microsatellite, de nombreux variants sont generalement observes. Des centaines 
de loci polymorphes sont presents tout au long du genome de chaque individu. Par un 
choix raisonne de microsatellites et d'amorces PCR pour leur identification apres 
amplification et separation electrophoretique, des empreintes genetiques specifiques 
de chaque individu de I'espece peuvent etre obtenues.C'est le principe du code-barre 
genetique utilise notamment par la police scientifique. 
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Analyse de I'ADN des membres de cette famille par PCR 
et electrophorese en gel de polyacryamide 

Figure 3.1 5 Diagnostic prenatal base sur I'utilisation du polymorphisme d'un 
microsatellite. 

Le microsatellite est situe dans la region promotrice du gene codant la dystrophine, 
une proteine importante dans la formation des muscles squelettiques. A la suite d'une 
reaction PCR et d'une analyse en gel de polyacrylamide, on observe chez un foetus en 
cours de gestation, la presence d'un amplifiat de 102 pb revelant un haplotype identique 
a celui de son oncle myopathe (atteint de la maladie de Duchenne). Le risque que le 
sujet developpe a la naissance cette maladie tres invalidante est done eleve. 



POINTS CLEFS 


>- L'ADN est un acide nucleique bicatenaire, e'est-a-dire constitue de deux 
brins polynucleotidiques associes par des liaisons hydrogene entre les bases 
puriques et pyrimidiques constitutives des nucleotides. Les liaisons hydro- 
gene s'etablissent toujours entre une purine de I'un des brins et une pyri- 
midine de I'autre brin. Dans cet appariement complementaire, I'adenine (A) 
est done toujours associee a la thymine (T) par deux liaisons hydrogene et 
la guanine (G) interagit toujours avec la cytosine (C) grace a trois liaisons 
hydrogenes. Ainsi, dans I'ADN, la quantite des purines (A + G) est egale a 
celle des pyrimidines (C +T). 

>- Le principe d'appariement complementaire des bases a une grande valeur 
pratique. II permet au geneticien de determiner la sequence nucleotidique 
d'un brin d'ADN a partir de celle du brin complementaire, qu'il s'agisse 
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d'un brin ADN ou d'un transcrit ARN. L'orientation d'un brin polynucleo- 
tidique est definie par la presence des groupes chimiques 5'-phosphate et 
3'-OH portes par les carbones 5' et 3' des deux desoxyriboses extremes. 
Dans la double helice d'ADN, les deux brins complementaires sont orientes 
en sens inverse. On dit qu'ils sont antiparalleles. 

>- A la surface de la molecule d'ADN, les deux brins torsades menagent deux 
sillons helicoidaux de largeur differente, un sillon majeur ou grand sillon et 
un sillon mineur ou petit sillon. Ces deux sillons, tout particulierement le 
grand sillon, exposent de nombreux groupes chimiques avec lesquels inter- 
agissent dans les conditions physiologiques de la cellule des proteines dites 
de liaison a I'ADN.Ces proteines assument des roles majeurs de regulation 
de I'expression de I'information genetique. 

>- Dans les cellules eucaryotes, a la difference des procaryotes, I'ADN est tres 
frequemment associe a des proteines basiques, les histones. Le resultat de 
I'assemblage regulier entre ADN et histones est designe par le terme de 
nudeosome. La formation des nucleosomes est la premiere etape d'un 
processus qui assure I'empaquetage de I'ADN en structures compactes 
reduisant enormement le volume occupe par la molecule. L'ensemble est 
designe sous le terme de chromatine. 

>- Certains amino-acides des queues d'histones sont parfois modifies par des 
groupes acetyle et methyle (lysine, arginine) ou phosphate (serine). Ces 
modifications facilitent ou alterent I'accessibilite de la chromatine. Elies 
constitueraient un « code epigenetique » qui pourrait etre lu par les proteines 
impliquees dans la regulation de I'expression des genes. 

>- Dans les cellules eucaryotes, le chromosome est le stade superieur et ultime 
d'organisation de I'ADN. Le nombre de chromosomes et leur composition 
sont des caracteristiques de chaque organisme. La duplication du chromo- 
some puis sa segregation s'opere dans des phases distinctes du cycle 
cellulaire (division cellulaire ou mitose).On distingue dans I'ordre 4 phases : 
G1,S,G2 et M. 

>- On designe par le terme de genome la sequence de I'ADN correspondant 
a un jeu haploide de chromosomes ( n chromosomes). Une cellule somatique 
humaine, diploide (2 n chromosomes), contient done deux genomes (un 
genome paternel et un genome maternel) alors qu'une cellule germinale 
(sexuelle), haploide (ovule ou spermatozoide),en contient un seul.Le terme 
genome s'applique aussi bien a I'ADN du noyau cellulaire (genome nudeaire) 
qu'a I'ADN des organites (genome mitochondrial, genome chloroplastique). 

>- Le sequengage d'un genome consiste a determiner I'ordre dans lequel 
sont agences lineairement les nucleotides constitutifs de I'ADN ou de I'ARN 
(pour certains virus). Les plus petits genomes (appartenant a des virus) posse- 
dent quelques milliers de paires de bases, les plus grands sont constitues de 
plusieurs milliards de paires de bases (certaines plantes, certains vertebres 
dont les mammiferes). 
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>- La sequence etablie de I'ADN humain (3, 2 milliards de pb) est aujourd'hui 
deposee dans les banques de donnees et elle est accessible pour tous par 
Internet. Un travail intense d'annotation destine a comprendre comment 
fonctionnent les instructions contenues dans la sequence a ete entrepris. II 
s'annonce long et complexe car il depend en grande partie de connaissances 
sur la nature exacte de ces instructions et sur leur mode depression. 

>- Dans un futur proche, la connaissance de la sequence ADN de chaque 
personne apportera une grande quantite de donnees genetiques qui seront 
utiles dans la prediction des maladies, leur diagnostic mais aussi dans leur 
traitement. 


QCM - QROC 

3.1 Valider ou non les affirmations suivantes. 

a) Les appariements entre les bases A, T, G, et C de I’ADN s’operent 
de fag on aleatoire. 

b) II y a autant de bases T et C dans I’ADN que de bases A et G. 

c) La synthese de I’ADN s’effectue dans la cellule grace a des ribo- 
nucleotides precurseurs. 

d) L’ARN peut former des structures en double helice. 

e) Les molecules d’ARN d’une cellule sont en majorite codantes. 

f) L’histone HI est la principale proteine du nucleosome. 

3.2 Les liaisons phosphodiesters des polynucleotides reunissent : 

a) des bases puriques et pyrimidiques ; 

b) des pentoses ; 

c) des nucleosides monophosphates ; 

d) des nucleosides triphosphates 

3.3 L’ adenine constitutive de I’ADN de deux especes bacteriennes 
est estimee respectivement a 30 % et 16 % de la totalite des bases. 
Quelles sont les proportions relatives des bases G, C, T, et A de ces 
deux echantillons ? L’une de ces bacteries a ete isolee a proximite 
d’un geyser d’eau chaude proche de 70 °C. Des deux ADN analyses, 
lequel provient de cette bacterie ? Expliquer. 

3.4 Le genome humain haploide (3,2 x 10 9 paires de bases environ) 
represente l’information contenue dans 1000 manuels de 500 pages 
chacun. Son support est une molecule d’ADN d’environ 1 m. Combien 
un manuel et une page du manuel representent-ils de paires de bases 
et de longueur d’ADN ? 
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3.5 Sachant qu'il y a chez l'homme 23 paires de chromosomes, 
qu'elle est la distance moyenne en kilobases separant deux origines 
de replication ? 

3.6 A combien de nucleosomes un ADN humain peut-il en theorie 
etre associe, sachant que dans sa forme conrpacte un nucleosome 
represente un ADN de 160 paires de bases et que la distance separant 
deux nucleosomes est en moyenne de 40 paires de bases ? Combien 
de molecules d’histone Hi et d’histone H2 seront-elles necessaires ? 

3.7 Creer une formule generale simple reliant la taille d’un ARNm, a 
la taille du gene correspondant, au nombre d’introns et a la taille 
moyenne de ces derniers. 

3.8 On estime que le genome humain contient 25 000 genes. En suppo- 
sant arbitrairement que les genes sont disposes de fagon reguliere et 
que la region codante moyenne d’un gene est de 2 kpb, quelle est la 
distance separant en moyenne le centre de deux genes ? Quelle est la 
proportion du genome qui code les proteines ? La nature des regions 
non codantes ? 


REPONSES 


3.1 a) non ; les appariements s’etablissent obligatoirement entre les 
bases A et T d’une part et G et C d’autre part, b) oui ; c) non ; grace a 
des desoxyribonucleotides precurseurs ; d) oui, de fag on partielle par 
repliement du polynucleotide sur lui-meme et a condition que la 
complementarite des bases A-U et G-C soit pour l’essentiel respectee ; 
e) non, seuls les ARN messagers qui represented 20 % environ des ARN 
cellulaires sont codants ; f) non, ce sont les histones de l’octamere 
H2A, H2B, H3 et H4 qui forment le nucleosome. 

3.2 c) 

3.3 L’un des ADN contient 30 % d’ adenine, 30 % de thymine, 20 % de 
guanine et 20 % de cytosine. L’ autre ADN contient 16 % d’ adenine, 
16 % de thymine, 34 % de guanine et 34 % de cytosine. L’ADN ayant 
la plus forte teneur en G + C (68 %) provient probablement de la 
resurgence d’eau chaude. En effet, le nombre de liaisons hydrogenes 
de la double helice le rend en effet plus stable vis-a-vis de la chaleur. 

3.4 Un manuel represente 3,2.10 6 pb et une longueur de 1 mm ; une 
page du manuel represente 6 400 paires de bases et une longueur de 
2 pm. 


Reponses 
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3.5 En moyenne, un chromosome contient 3,2 x 10 9 /23 soit 1,39 x 10 8 
paires de bases. Si l’on considere environ 3 000 origines de replication 
par chromosome, la distance separant en moyenne deux origines de 
replication sera de 46 300 paires de bases. 

3.6 On considere qu’a chaque ADN nucleosomal est associe un ADN 
de liaison, soit 160 + 40 = 200 paires de bases. Chaque ensemble sera 
done represente 3,2 x 10 9 /200, soit 1,6 x 10 8 fois. 11 y aura done 
160 000 000 de nucleosomes ; il y aura un nombre identique d’histones 
HI et quatre fois plus d'histone H2 puisque cette derniere existe sous 
deux formes (H2A et H2B) et que chacune est representee deux fois 
dans l’octamere d'histones. 

3.7 (Taille du gene - taille de l’ARNm)/nombre d’introns = taille 
moyenne des introns 

3.8 La distance moyenne separant le centre de deux genes est de 
32000000 kpb, divisee par 25 000, soit 128 kpb. La proportion du 
genome humain qui code des proteines est done de 1,56 % environ. 
Les autres sequences comprennent diverses regions intergeniques, repe- 
tees et non repetees, des transposons, des pseudogenes, des regions 
regulatrices, des introns, etc. 
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U Introduction 
a la genetique 
des micro-organismes 


4.1 Genetique bacterienne 

4.2 Genetique des bacteriophages 

4.3 Test de complementation ou test d'allelisme fonctionnel 

4.4 Test d'allelisme structural 

4.5 Genetique de la levure 

4.6 Micro-organismes et genie genetique 
Comprendre le transfert d'ADN chez les bacteries 
Aborder les mecanismes de transduction 
Comprendre I'interet des tests de complementation 
Integrer les applications de la genetique des micro-organismes 


Des qu’il fut clair que des relations directes existaient entre le materiel 
hereditaire et les caracteristiques fonctionnelles d’une cellule ou d’un 
organisme, les micro-organismes s’imposerent comme des outils de 
choix pour explorer en profondeur la nature des genes. Pourtant, on 
ne peut pas dire a priori que, n’etant pas visibles a l’oeil nu, les micro- 
organismes possedent des caracteristiques facilement reconnaissables. 
Le fait d’avoir assez rapidement caracterise leurs defauts metaboliques, 
isole les souches mutantes, etabli une relation entre des variants bio- 
chimiques et les mutations geniques, en un mot, engage une veritable 
demarche d’etude genetique fondee sur les relations entre genes et 
fonctions, a largement contribue a leur succes. 

Etant donne qu'il s’agit d’organismes haploides, V analyse genetique 
ne depend pas du fait qu’une mutation soit dominante ou recessive 
puisqu’un seul allele du gene etudie est present. II ne peut done pas 
etre masque dans son expression par un autre allele, comme e’est 
frequemment le cas pour les organismes diploi'des. De plus, les micro- 
organismes, tout particulierement les bacteries, peuvent produire une 
nouvelle generation de cellules en moyenne toutes les heures, ce qui. 
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pour le geneticien qui etudie la transmission des caracteres et des genes 
au cours des generations successives, constitue un avantage considerable. 

Pour toutes ces raisons et d’autres qui seront abordees au til de ce 
chapitre, la genetique des micro-organismes a contribue de fagon deci- 
sive a fonder les concepts majeurs de la genetique. Elle a su realiser 
avant toute autre, la syn these entre l’approche phenomenologique (les 
phenotypes) et l’approche moleculaire (les genes et l’ADN). 

4.1 GENETIQUE BACTERIENNE 

Les bacteries appartiennent a une classe d’organismes appeles pro- 
caryotes qui inclut egalement les algues bleues ou cyanobacteries. 
Les procaryotes ne possedent pas de noyau. Leurs genes, constitues 
d’ ADN, sont regroupes essentiellement sur un seul chromosome circu- 
laire. Des structures de plus petite taille, les plasmides, portent des genes, 
tels les genes de resistance a des agents chimiques, qui foumissent a la 
cellule la possibility de vivre et se multiplier dans un environnement 
defavor able. 

Organismes modeles dont le plus connu est la bacterie Escherichia 
coli (E. coli), ils se divisent rapidement et se cultivent sur des milieux 
liquides ou solides contenant les elements nutritifs de base (milieu 
minimal : sels inorganiques et une source de carbone). Cultivees sur 
milieu solide en boite de Petri, les bacteries sont immobilisees et 
restent regroupees. A partir de 10 7 cellules, la masse de cellules cons- 
titue une colonie, visible a l’ceil nu. Toutes les cellules d’une colonie 
isolee sur une boite sont issues d’une seule cellule, elles ont done 
toutes le meme materiel genetique et constituent un clone. 

Mutants bacteriens 

En traitant les bacteries avec des agents mutagenes, on peut obtenir de 
tres nombreuses mutations qui empechent la cellule de se multiplier 
dans un milieu minimal. Elle ne pourra croitre que si Ton ajoute a ce 
milieu tel ou tel metabolite dont la synthese n’est plus assuree dans la 
cellule mutante. Ainsi, un grand nombre de mutations touchant la 
synthese des metabolites essentiels pour la croissance bacterienne ont 
ete identifiees, chacune d’entre elles correspondant a Tune des enzymes 
mises en jeu dans les etapes de biosynthese des diverses molecules 
biologiques. 

Pour une espece bacterienne donnee, la souche qui a perdu la capacite 
de synthetiser un metabolite essentiel (un acide amine par exemple) 
est dite auxotrophe (pour cet acide amine). A l’inverse, la souche de 
type sauvage qui ne presente pas cette exigence nutritionnelle sera 
dite prototrophe. Certains mutants ne sont plus capables d’utiliser 
par exemple un ose particulier comme source de carbone, on parle alors 
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de mutants cataboliques. Certaines substances chimiques, comme 
les antibiotiques, peuvent tuer les bacteries mais certaines d’entre elles, 
appeles mutants resistants, peuvent se diviser meme en presence de 
l'antibiotique et fonder des colonies. Tous ces divers types de mutants 
( Tableau 4.1) fournissent des marqueurs genetiques pour suivre 
E evolution des genomes lors d’experiences. 


Tableau 4.1 Symboles utilises en gEnetique bactErienne. 


Symboles 

Phenotypes associes 

leu ~ 

Auxotrophe pour la leucine qui doit etre en plus du milieu minimum 

leu + 

Prototrophe pour la leucine, alors inutile dans le milieu minimum 

lac~ 

Incapable d'utiliser le lactose comme source de carbone 

lac + 

Utilise le lactose comme source de carbone 

amp s 

Sensibilite a un antibiotique, ici I'ampicilline 

amp' 

Resistance a un antibiotique, I'ampicilline 


Conjugaison bacterienne 

En 1946, Joshua Lederberg et Edward Tatum, par une experience a la 
fois simple et elegante, exploitent les exigences d’E. coli en certains 
nutriments pour demontrer l’existence de la recombinaison genetique. 
Ils utilisent deux souches A et B presentant des exigences nutritionnelles 
differentes. 

La souche A est auxotrophe pour la methionine et la biotine et 
prototrophe pour la leucine et la threonine ; son phenotype est done : 
met - , bio - , leu + , thr + . La souche B est auxotrophe pour la threonine et 
la leucine et prototrophe pour la methionine et la biotine ; d’ou son 
phenotype : met + , bio + , leu - , th r. Si des cultures de bacteries A et B 
en melange sont etalees sur des boites contenant un milieu minimum 
sans supplement nutritionnel, quelques colonies apparaissent apres 
48 h. Seules des bacteries prototrophes (met + , bio + , leu + , thr + ) sont 
capables de se developper sur un tel milieu. Par contre, aucune colonie 
n’est visible sur les boites temoins ensemencees avec des bacteries A 
ou B (Fig. 4.1). Pour s’ assurer que les souches ne secretaient pas de 
substances qui auraient ete absorbees et utihser par les autres cellules 
pour leur proliferation, Bernard Davis construisit un tube en U dont 
les deux bras sont separes par un filtre qui ne peut laisser passer que 
les molecules dissoutes dans le milieu. En introduisant la souche A 
dans un bras, et la souche B dans V autre, et apres plusieurs heures 
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d’ incubation, Davis testa les cellules de chaque bras du tube et constata 
I’ absence de cellules de phenotype met + , bio + , leu + , thr + . II en conclut 
qu’une union physique des bacteries est necessaire pour qu'un transfert 
d’information genetique entre les deux souches ait eu lieu. Cette union 
physique, visible en microscopie electronique, est appelee conjugaison. 


Souche A 

Met - Bio - Leu + Thr+ 



Souche B 

Met + Bio + Leu - Thr - 





Milieu minimum 


Milieu minimum 


Aucune colonie 

Melange des 
souches A et B 

Aucune colonie 

ne pousse 


ne pousse 


Incubation 

Etalement 



Milieu minimum 


Apparition de quelques 
colonies de phenotype 
(Met+ Bio+ Leu + Thr + ) 


Figure 4.1 Mise en evidence du transfert de materiel genetique entre bacteries. 

Les souches A et B ne peuvent pas se diviser sur un milieu minimal. En effet la souche A 
doit trouver dans le milieu la methionine et la biotine et la souche B, la leucine et la 
threonine. Or, ie milieu minimal ne les contient pas. Le melange des souches, qui favorise 
le transfert de materiel genetique, conduit a I'apparition de colonies recombinantes 
capables de synthetiser elles-memes les quatre metabolites a partir des constituants 
du milieu minimal. 


Le facteur sexuel 

L’ experience decrite ci-dessus suggere l’existence d’une sexualite chez 
les bacteries. En effet, il existe des cellules avec un role de donneur 
et des cellules ayant le role de receveur. Cependant, les genomes de 
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ces bacteries ne fusionnent jamais en entier pour constituer un nouveau 
descendant comme chez les organismes superieurs. Le transfert de 
Tinformation genetique est unidirectionnel et est assure par un facteur 
de fertilite ou facteur F. C’est un ADN circulaire autoreplicatif 
appele episome dont heritent les cellules filles independamment du 
chromosome bacterien (Fig. 4.2). Les bacteries qui le possedent sont 
dites F + assurant le role de donneur, et celles qui ne le possedent pas 
sont dites F - et receveuse. Le facteur F comporte, entre autre, toute 
l’information genetique necessaire pour son transfert d’une bacterie 
F + vers une bacterie F _ . Lors du transfert, un contact physique (pont 
cytoplasmique) s’etablit entre les deux bacteries, grace notamment a 
Taction de pili sexuels codes par le facteur F et qui se trouvent a la 
surface des bacteries F + . 


a) 


c) 



Facteur F Chromosome 
bacterien 




Inegration du facteur F 




Bacterie Hfr 






S5* 





F+ 


F+ 


Figure 4.2 Quelques proprietes de I'episome ou facteur F. 

En a, present dans les bacteries F + , le facteur F se replique de fa^on autonome et il est 
herite par toutes les cellules filles ; en b, lors du croisement d'une souche F+ avec une 
souche F", toutes les bacteries deviennent F+;eten c, formation d'une bacterie Hfr. 


Quand on croise des bacteries F + et des bacteries F _ toutes les 
bacteries deviennent F + . Dans les bacteries donneuses, une copie 
simple-brin de l’ADN F est synthetisee selon un mecanisme particulier 
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appele replication en cercle roulant. Un brin de I' ADN F est transfere 
dans le cytoplasme de la cellule receptrice ou il va servir de matrice 
pour la synthese du second brin. L’ autre brin d’ADN reste dans la 
cellule donneuse lui permettra de la meme facon de reconstituer par 
synthese du brin complementaire un facteur F fonctionnel. Dans ce 
type de croisement, aucun fragment du chromosome bacterien de la 
souche F + n’est transfere vers la souche F _ , on assiste seulement au 
transfert entier du facteur F selon des modalites respectant le principe de 
replication semi-conservative (Fig. 4.2). La conjugaison bacterienne 
permet le transfert de l’ADN (facteur F dans le cas present), d’une 
bacterie a une autre. 

Les souches Hfr 

Le croisement d’une souche F + de type sauvage, c’est-a-dire non 
mu tee avec une souche F _ auxotrophe pour certains metabolites et 
resistante a un antibiotique puis l’etalement du melange sur le milieu 
de selection (milieu minimum contenant F antibiotique) aboutissent au 
developpement de quelques rares colonies recombinantes temoignant 
du transfert de materiel genetique entre les deux souches bacteriennes. 
Les colonies recombinantes proviennent de bacteries F _ (auxotrophes) 
ayant recu par conjugaison les genes necessaires pour restaurer leur 
capacite a croitre sur le milieu minimum, c’est-a-dire presentant le 
phenotype sauvage. Cette conjugaison exceptionnelle ou quelques rares 
bacteries F + transferent du materiel genetique a partir de leur chromo- 
some principal est due a 1’ integration du facteur F dans le chromosome 
principal (Fig. 4.2). II est possible d’isoler les quelques cellules qui 
ont integre le facteur F dans leur chromosome. 

Si l’experience de croisement est alors repetee avec la nouvelle 
population constitute de cellules ayant integre le facteur F dans 
leur chromosome, on obtient 1000 fois plus de recombinants. Ces 
souches sont appelees pour cette raison Hfr pour Haute frequence de 
recombinaison. 

Grace a l’integration du facteur F dans le chromosome principal, 
ces souches peuvent transferer efficacement aux souches F _ une partie 
de leur genome. De ce fait, la bacterie receptrice peut devenir, a cause 
du fragment de chromosome recu. homologue de son propre chromo- 
some, une cellule partiellement diploide. Cette information genetique 
transferee s’integre ensuite dans le chromosome de la bacterie F _ par 
un double crossing-over (Fig. 4.3), ce qui permet d’obtenir des cellules 
et des colonies recombinantes stables. Les cellules F _ qui portent un 
allele du donneur ont done participe a la conjugaison et sont appelees 
exconjugants. 
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Integration de a + par double 
crossing-over 



Bacteries F (a+ Str r ) 



Milieu + streptomycine 


Selection de recombinants 
pour le caractere a + 


Figure 4.3 Principe de I'integration de marqueurs genetiques dans le chromo- 
some bacterien et selection des cellules recombinantes. 

La bacterie F~ est auxotrophe pour un acide amine (a-) et resistante a la streptomycine 
(Str r ). La bacterie Hfr est prototrophe (a+) et sensible (Str s ). Le transfert oriente vers la 
bacterie F ^ de la region chromosomique (a + ) contenant le(s) gene(s) permettant la 
synthese de I'acide amine, suivi d'un double crossing-over, entraine la creation d'une 
souche recombinante (a + , Str r ) qui peut croitre et former des colonies sur un milieu 
minimal contenant de la streptomycine, milieu qui n'autorise ni la croissance de la souche 
Hfr (Str s ), ni celle de la souche F~ (a - ). 


II existe un grand nombre de souches de type Hfr puisque I’integration 
du facteur F s’effectue grace a un mecanisme de crossing-over en de 
nombreux sites du chromosome de la bacterie (Fig. 4.4). Les regions 
d’appariements, identiques sur le plasmide et le chromosome, provien- 
nent d’elements mobiles, appeles sequences d’insertion. Toutes ces 
souches Hfr transferent done a des souches F - toujours la partie de 
leur chromosome qui est immediatement en amont de l’origine de trans- 
fert. En effet, l’origine et la direction du transfert sont determinees par 
la meme extremite du facteur F, appelee origine de transfert liberee 
par clivage. Lors de la conjugaison d’une bacterie Hfr avec une 
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bacterie F _ , l’information genetique du facteur F sera done toujours 
transferee en dernier lieu apres que tout le chromosome de la souche 
Hfr soit transfere, e’est-a-dire tres rarement. Le processus est fragile 
et la rupture du pont cytoplasmique et de 1’ ADN en cours de transfert 
se produit frequemment. Par consequent, la souche F _ n’est quasiment 
jamais convertie en F + ou en FIfr a la suite de son croisement avec la 
souche FIfr. 


a) Origine de b) 

transfert (T) 



c) 

Gen^l ^ ^ ^^ Gene A ^ Gene 2 ^ 

Gene Gene D Gene B 

de la fertility 

Figure 4.4 Integration du facteur F dans le chromosome bacterien et transfert 
oriente de marqueurs genetiques. 

En a, le facteur F s'integre dans le chromosome bacterien par crossing-over en mettant 
en jeu des homologies de sequences entre les deux molecules d'ADN. En b, le facteur 
F integre dans le chromosome d'une bacterie devenue de ce fait FIfr ; en c, dans le cas 
present I'endroit ou s'integre le facteur F permet le transfert a partir de I'origine T des 
marqueurs dans I'ordre, A, B, C et D (1 et 2 sont des marqueurs symboliques pour 
orienterl'ADN insere). 


Bien que le facteur F s’integre de fatjon stable dans le chromosome 
de la souche Hfr, parfois il quitte le chromosome par inversion exacte 
du processus de recombinaison qui lui a permis son insertion. Parfois, 
sa sortie n’est pas rigoureusement identique a l’insertion, le plasmide 
emportant avec lui une partie du chromosome bacterien. Le nouveau 
plasmide qui en resulte s’appelle plasmide F’. Les facteurs F’ peuvent 
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porter plusieurs genes chromosomiques et sont nommes d’apres les 
genes supplementaires qu’ils portent. 

Cartographie par conjugaison 

La figure 4.5 decrit le principe d’une experience de conjugaison inter- 
rompue chez les bacteries. Au bout de 5 min de conjugaison entre la 
souche Hfr et la souche F - , aucun recombinant ne sera obtenu pour les 
marqueurs genetiques testes quel que soit le crible de selection utilise. 
Apres 15 min de conjugaison, on peut caracteriser des recombinants 
de la souche F _ pour a + , b + . Le crible de selection des recombinants 




Figure 4.5 En a : Principe dune experience de conjugaison interrompue chez les 
bacteries. On a represente le passage du chromosome de la bacterie Hfr dans la 
bacterie F~ et la rupture du pont cytoplasmique et du chromosome en fonction 
du temps. L'arret de la conjugaison s'effectue par agitation. Une partie du fragment 
d'ADN ayant penetre dans la bacterie receveuse peut s'integrer par recombinaison 
homologue dans le chromosome. En b, chromosomes de deux souches Hfr. L'origine 
de transfert est representee par un triangle, le terminus de transfert par un rectangle 
noir. La position et I'orientation de l'origine de transfert imposent le sens du trans- 
fert. Pour la souche 1 c'est le gene pur qui sera transfereen premier alors que pour 
la souche 2 c'est le gene his. 
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est tres important : si au bout de 15 min de conjugaison, on selec- 
tionne les recombinants uniquement pour le caractere a + parmi tous 
les recombinants a + obtenus, certains seront a + b + mais on n’aura 
jamais de recombinant pour b + uniquement. Autrement dit, le 
premier crossing-over dans ces conditions a eu lieu obligatoirement 
du cote de l’origine de transfert et le deuxieme soit entre a + et b + 
(recombinant a + ) soit en dehors de l’intervalle separant a + de b + 
(recombinant a + b + ). 11 ne faut pas oublier que deux crossing-over 
sont necessaires pour l’echange d’information genetique entre un 
fragment lineaire d’ADN (fragment transfere) et un ADN circulaire 
(chromosome bacterien). 

Cette experience type peut etre exploitee pour determiner la liaison 
entre les genes. Pour qu’un exconjugant integre dans son chromosome 
les genes du donneur de maniere definitive, le fragment chromoso- 
mique du donneur doit recombiner avec le chromosome du receveur. 
II faut noter que les unites sont des minutes et non des frequences de 
recombinaison. 11 s’avere neanmoins possible d'utiliser la frequence 
de recombinaison pour la cartographic du chromosome bacterien. La 
recombinaison se produit ici entre un genome complet issu de F _ , 
appele l’endogenote, et celui incomplet, appele l’exogenote, issu du 
donneur Hfr. A ce stade la cellule possede deux copies d’un fragment 
d’ADN, c’est un diploide partiel ou merozygote. Un seul crossing- 
over dans un merozygote ouvrirait le cercle et il n’y aurait pas de 
recombinant viable. Pour que le chromosome demeure circulaire, il 
faut obligatoirement un nombre pair de crossing-over. 

Pour determiner la liaison et obtenir des distances cartographiques 
significatives, il est necessaire d’etablir des conditions dans lesquelles 
tous les marqueurs ont une probability egale d’etre transmis, de sorte 
que les frequences de recombinaison ne dependent que de la distance 
entre les genes consideres. De ce fait, pour etudier la liaison genetique 
entre les marqueurs a + , b + , c + , d + , et e + par exemple, il faut selec- 
tionner les recombinants pour le dernier marqueur qui sera transfere, 
c’est-a-dire e + dans le cas present (Fig. 4.5). Pourquoi ? Parce que nous 
savons que chaque cellule qui a reyu un fragment de chromosome 
portant le dernier marqueur a egalement recu les marqueurs anterieurs 
(a + , b + , c + et d + ). Nous pouvons alors calculer la distance entre 
marqueurs qui est egale au pourcentage de crossing-over dans les 
intervalles qui les separent. Pratiquement, cela revient a calculer parmi 
le nombre total de recombinants obtenus pour un marqueur determine 
le pourcentage de ceux qui l’ont ete grace a un crossing-over entre ce 
marqueur et le marqueur voisin. 

En combinant 1’ utilisation de diverses souches Hfr portant les memes 
marqueurs genetiques (locus d’auxotrophie pour tel ou tel acide amine 
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par exemple), on constate que l’ordre de transfert des marqueurs n’est 
pas conserve d’une souche a l’autre, ce qui s’explique par la circularite 
du chromosome bacterien d’une part, l’origine et la direction du transfert 
d’ autre part. En repetant 1’ experience avec une autre souche Hfr qui 
transfere le marqueur b + en premier, celui qui sera transfere le dernier 
ne sera plus e + mais a + . De plus, en jouant sur le temps de transfert, 
qui peut etre controle en provoquant la rupture du pont cytoplasmique 
et de l’ADN par une vigoureuse agitation, on a pu cartographier, 
c’est-a-dire determiner la position relative des loci d’auxotrophie, 
la resistance a des antibiotiques, a l’infection phagique, en un mot, 
cartographier le chromosome bacterien. 

Les plasmides R 

La resistance multiple aux antibiotiques est certainement la propriete 
la plus alarmante des bacteries pathogenes, mise en evidence dans les 
annees 1950, avec des bacteries du genre Shigella responsables de la 
dysenterie. La bacterie a tres rapidement acquis une resistance a de 
nombreux antibiotiques (penicilline, tetracycline, streptomycine, etc.) 
couramment utilises pour enrayer la maladie. Ce phenotype de resis- 
tance multiple transmis sous la forme d’un groupe genetique unique, 
peut se transmettre non seulement a d’autres souches de Shigella mais 
egalement a des especes apparentees. Cette propriete, proche de la 
mobilite du facteur L chez E. coli, est tres favorable pour la bacterie 
pathogene car la resistance se propage tres rapidement a travers une 
population. Les vecteurs transportant les multiples resistances d’une 
cellule a une autre appartiennent a un groupe de plasmides, les plas- 
mides R qui sont transferes rapidement lors de conjugaisons cellulaires. 
Les premiers decouverts, les plasmides R de Shigella, font partie d’une 
grande serie de plasmides de meme type. Tous presents a l’etat plasmi- 
dique dans le cytoplasme des bacteries, ils portent de nombreux types 
differents de genes comme les genes de resistance aux metaux lourds 
(plasmide R6), de production de bacteriocines (plasmide Col El), de 
tumorigenicite dans les plantes (plasmide T1 chez Agrobacterium 
tumefaciens). 

La transformation bacterienne 

Le mecanisme par lequel une bacterie absorbe de l’ADN exogene a partir 
de son environnement et l’integre de fagon fonctionnelle dans son 
chromosome est appele transformation. Ce mecanisme de modification 
des proprietes genetiques par de l’ADN en solution fut decouvert chez 
Streptococcus pneumoniae en 1928 par Lrederick Griffith et Oswald 
Avery. Par la suite, en 1944, Avery, Mac Leod et Mac Carty demontrerent 
que le principe transformant etait bien de l’ADN. 
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Competence genetique naturelle chez les bacteries 

Tout d’abord observee chez la bacterie Gram-positive, S. pneumoniae, 
la transformation se revela un processus naturel chez de nombreuses 
bacteries Gram-positives et Gram-negatives. La capacite qu’ont les 
bacteries a absorber naturellement des fragments d’ADN exogene en 
solution, processus nomme competence naturelle, est genetiquement 
definie. En effet, les bacteries competentes, expriment des proteines 
specialisees qui peimettent aux cellules de capter puis d’integrer des 
fragments d’ADN presents occasionnellement dans leur environnement 
(Fig. 4.6). 



Formation d’un complexe 
proteique fixant I’ADN 

Absorption de I’ADN issu 
d'une bacterie morte 



Degradation par une DNAse 
d’un des 2 brins de I'ADN 



Integration dans le chromosome 
bacterien 


Figure 4.6 Principe de la transformation bacterienne. Un fragment d'ADN libere 
par une bacterie morte est absorbe. Au niveau des proteines du complexe de 
fixation de I'ADN, et au cours de son entree un des brins de I'ADN est degrade, 
I'autre brin envahit I'ADN de la cellule receveuse. Celui-ci sera par la suite, apres 
synthese du brin complementaire, integre dans le chromosome bacterien. 


La fixation de I’ADN chez Neisseria gonorrheae et Haemophilus 
influenzae est selective dans la mesure ou le fragment incorpore doit 
contenir une sequence nucleotidique specifique. Chez H. influenzae, 
il doit contenir une sequence consensuelle de 29 pb avec un segment 
hautement conserve de 9 pb. Aujourd’hui, grace au sequengage du 
genome de cet organisme, on sait que cette sequence est frequemment 
representee. Au total, 1 465 sequences de ce type ont ete identifiees 
dans le genome de H. influenzae qui a une taille de 1 830 kpb. C’est 
une sorte de signature, d’identite, du genome de cet organisme. Pour 
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Streptococcus pneumoniae et Bacillus subtilis, l’absorption de l’ADN 
n’est pas selective. Aucune sequence specifique n’est requise pour trans- 
former ces deux bacteries. Cependant, chez les deux, le developpement 
de la competence est regule par une sorte de communication entre les 
cellules : avant de developper son etat de competence, une cellule doit 
recevoir un signal des autres cellules de la population. Un tel systeme 
permettrait aux cellules de ne developper un etat de competence qu’au 
voisinage d’ autres cellules de la meme espece et par consequent, de 
n’absorber que de l’ADN propre a cette espece. 

La transformation artificielle 

Les mecanismes de transformation naturelle decrits ci-dessus mettent 
en jeu un grand nombre de proteines, et parfois une sequence d’ADN 
specifique. Au vu de la complexity de ce systeme de transformation 
naturelle, l’application de la technologie de l’ADN recombinant a ces 
micro-organismes reste relativement difficile. D’ autres bacteries comme 
E. coli, sont plus facilement transformables par de l’ADN exogene. 
L’etat de competence de ces bacteries peut etre accru en les traitant 
par des ions divalents comme le Ca 2+ . On parle dans ce cas de trans- 
formation artificielle. La transformation artificielle induite par Ca 2+ 
n’est efficace chez E. coli que lorsque 1’ ADN est ajoute sous une forme 
capable d’ autoreplication. Les ADN de plasmides et les chromosomes 
viraux intacts ont une grande efficacite de transformation, alors que 
les fragments lineaires d’ADN bacterien transforment tres faiblement 
les bacteries. 

Ainsi, la transformation bacterienne qui revela au monde que 1’ ADN 
est le support du materiel genetique, nous foumit aujourd’hui un moyen 
puissant pour l’etude des genes in vivo et in vitro. Le mecanisme de 
transformation des bacteries par des plasmides permet theoriquement 
d’introduire n’importe quel fragment d’ADN dans une cellule pour 
etudier les consequences de son expression. 

Cartographie du chromosome bacterien grace a la transformation 

Nous avons vu que la transformation des bacteries par 1’ ADN en solution 
permettait de transferer un caractere d’une bacterie a une autre. 

Considerons deux bacteries, l’une receptrice, l’autre donatrice, 
differentes par plusieurs caracteres : soit a, b, c, d, les genes gouvemant 
les caracteres distinctifs de la bacterie receptrice et A, B, C, D, ceux de 
la bacterie donatrice. Pour chacun des caracteres, on observe que la 
frequence d’ apparition des bacteries transformees portant un seul 
caractere nouveau est de l’ordre de 10 -2 . 

Les frequences des bacteries transformees simultanement pour deux 
caracteres (double transformation) sont en general egales au produit 
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des frequences de chacune des transformations simples (par exemple 
pour CD 10 -2 x 10 -2 = 10 -4 ). En revanche pour BC cette frequence 
est plus elevee 0,2 x 10 -2 . L’ explication est que les genes B et C sont 
suffisamment proches sur le chromosome bacterien pour etre portes 
par un meme fragment de telle sorte que les doubles transformes BC 
resultent de la penetration dans la bacterie receptrice d’un unique 
fragment (genes lies). En appliquant cette technique, on a pu etablir la 
carte du chromosome de B. subtilis. 

4.2 GENETIQUE DES BACTERIOPHAGES 

Le cycle biologique des bacteriophages 

C’est par necessite biologique que les virus sont des parasites. Ils ne 
possedent pas la capacite de synthetiser leurs composants de faqon 
independante. Pour se reproduire, ils doivent introduire leur genome 
dans une cellule hote vivante. Tous les virus sont de petites particules 
formees d’une enveloppe protectrice riche en proteines qui facilite 
leur transport d’une cellule a l’autre. Leur materiel genetique est soit 
de 1’ ADN, soit de EARN mais jamais les deux en meme temps. 

Les bacteriophages (ou phages) sont des virus qui infectent les 
bacteries. Ils ont joue, et continuent de jouer, un role fondamental 
dans la genetique bacterienne et la genetique moleculaire en general. 
Pendant plus de trente ans (1940-1973), ils ont ete des outils precieux 
pour etudier les consequences de l’introduction d'un nouveau materiel 
genetique dans une cellule. Ainsi, les etudes menees sur les phages 
ont aide a la comprehension des structures et de l’expression des genes, 
P assemblage de structures biologiques complexes et le transfert de 
materiel genetique entre bacteries. 

Les phages les plus etudies sont ceux qui se multiplient chez E. coli 
ou des bacteries tres proches. On les a arbitrairement nommes Tl, T2, 
T4, PI, FI, M13 ou X par exemple. Un phage infecte une bacterie en 
s’attachant a un recepteur specifique de la surface bacterienne. Une 
fois fixe, le phage injecte son materiel genetique dans le cytoplasme. 
Certains des genes du phage sont exprimes immediatement (genes 
precoces) apres l’injection de V ADN dans la bacterie, en utilisant des 
enzymes presentes dans le cytoplasme de la bacterie. Ces genes 
precoces codent des enzymes necessaires a la replication de l’ADN 
phagique en un grand nombre de copies. Les genes tardifs commencent 
ensuite a s’exprimer. Ce sont principalement des genes qui codent les 
proteines necessaires a la production de nouvelles capsides phagiques. 
Une fois les differents constituants phagiques assembles, la paroi 
bacterienne est detruite (on parle de lyse bacterienne), liberant un grand 
nombre de nouveaux phages dans le milieu environnant. Chacun d’entre 
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eux est capable d’infecter une nouvelle bacterie, ce qui permet un 
nouveau cycle biologique du phage (Fig. 4.7). 



Proliferation des 
bacteries 


Figure 4.7 Cycle lytique d'un bacteriophage (a), et cycle lysogenique (b). 


La lysogenie 

Dans les annees 1920, on a observe que certaines souches bacteriennes 
apparaissaient resistantes a certains phages. Cependant, ces bacteries 
resistantes entramaient la lyse d’autres bacteries lorsqu’on melangeait 
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les cultures. Ces bacteries resistantes sont dites lysogenes. Vers le milieu 
des annees 1940, Andre Lwoff montra qu'une bacterie lysogene est 
une bacterie qui contient un genome viral, insere en un point deter- 
mine de son propre chromosome. La presence de l’ADN du phage a 
l’etat integre dans le chromosome bacterien, on parle de prophage, 
protege la bacterie de 1’ infection par un autre phage (surinfection). Cette 
immunite reste stable et peut etre transmise aux cellules bacteriennes 
Lilies. Le prophage se duplique par consequent au meme titre que les 
autres regions du chromosome bacterien. Chez une petite fraction de 
cellules lysogenes, on peut assister a la production de phages infectieux. 
On parle de l’induction du prophage des bacteries lysogenes. Ce 
processus prive, evidemment, la cellule de son immunite, lyse la bacterie 
et libere les phages infectieux dans le milieu. Ces derniers peuvent 
infecter toute bacterie non lysogene presente dans le milieu de culture. 

Des etudes ulterieures montrerent que differents agents, tels que le 
rayonnement ultraviolet ou certains produits chimiques, pouvaient 
induire la lyse d’une fraction importante d’une population de bacteries 
lysogenes. 

Ainsi, on a pu classer les phages en deux categories : 

>- les phages virulents : ils provoquent toujours la lyse des bacteries 
et ne peuvent exister a l’etat de prophage ; 

>- les phages temperes : ils suivent frequemment un cycle lysogenique 
et s’installent dans la bacterie hote sous forme de prophage. Dans 
certaines conditions, ils peuvent suivre un cycle lytique, lorsque le 
prophage est induit. 

La transduction 

En 195 1 , J. Lederberg et N. Zinder, travaillant sur la bacterie Salmonella, 
montrerent que des caracteres pouvaient etre transmis de faqon passive 
d’une bacterie a une autre par T intermediate d’un bacteriophage. Ils 
appelerent ce phenomene la transduction. 

Une experience typique de transduction consiste a infecter une 
bacterie leu + par un phage transducteur specifique de cette bacterie. 
Le developpement de ce phage dans les bacteries entraine leur lyse, 
ce qui libere un grand nombre de descendants. La majorite de ces 
phages est identique au phage infectant. Exceptionnellement, la capside 
renferme un fragment d’ADN du chromosome bacterien integre dans 
la molecule d’ADN du phage. Quand on infecte une culture de bacteries 
leu - par - le lysat contenant l’ensemble des phages, certains de ceux qui 
ont « embarque » un petit fragment de chromosome bacterien intro- 
duisent dans les bacteries receptrices le gene leu + . Par recombinaison, 
1’ allele leu + peut se substituer a T allele leir et la bacterie se trouve 
transduite pour ce caractere. Tout fragment de l’ADN de la bacterie 
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donneuse portant un marqueur genetique pourra se trouver transduit 
de la sorte. On parle alors de transduction generalisee (Fig. 4.8). 

II existe un autre type de phages transducteurs qui ne transportent 
qu’une partie restreinte et bien determinee du chromosome bacterien 
du fait d’une insertion du transducteur en une position precise du 





Bacterie transduite portant 
le caractere Leu + 


Figure 4.8 Mecanisme de la transduction generalisee. Le gene leuB code la 
(5-isoproylmalate deshydrogenase, enzyme impliquee dans la voie de biosynthese 
de la leucine. L'allele mute de ce gene est note leub. 
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chromosome bacterien. Ce phenomene est appele transduction specia- 
lisee. Le phage X, phage tempere, constitue un bon exemple de trans- 
ducteur specialise. L’ induction du prophage X de la bacterie E. coli 
lysogene entraine la production de certaines particules defectueuses 
due a une excision incorrecte du prophage. Le genome du phage 
emporte avec lui un fragment d’ADN du chromosome d’E. coli alors 
que certains genes phagiques restent dans le chromosome bacterien 
(Fig. 4.9). Cet ADN phagique anormal, portant des genes bacteriens 
gal ou bio proches du site d’ integration (on appelle ces phages Algal 
pour Adefectueux gal, ou Albio), peut etre empaquete et infecter 
d’autres bacteries. Si une particule phagique normale infecte egalement 
la bacterie (double infection) Algal peut s’integrer dans le genome de 
l’hote au site specifique de fixation du phage X. Ainsi, les genes gal 
sont transduits chez la deuxieme bacterie infectee. 

Les sequences appelees alt (« attachement ») contenant les sites 
specifiques sur F ADN phagique (attP) et sur le chromosome bacterien 
(i attB ) ne contiennent qu’une tres courte region d'homologie. La reaction 
d’integration est catalysee par l’enzyme Int (integrase) synthetisee 
par le bacteriophage X de fa?on abondante au debut de F infection. 
Participe egalement a cette catalyse une proteine accessoire d’E. coli 
appelee IHF (Integration Host Factor : facteur d’integration a l’hote). 

L’integration du phage X est reversible et son excision necessite une 
seconde enzyme Xis (excisionnase) synthetisee elle aussi par le phage. 
La formation d'un complexe entre F integrase et Xis catalyse F excision 
du prophage, ce qui permet de reconstituer un ADN bacterien et un 
ADN phagique intacts (Fig. 4.9). 

La transduction generalisee peut etre exploitee pour cartographier 
le chromosome bacterien, c’est la cartographic par transduction. 
Supposons que l’on souhaite determiner les positions relatives des 
marqueurs genetiques a + , b + , c + sur le chromosome bacterien. On peut 
faire croitre par exemple le phage transducteur PI en infectant une 
souche a + , b + , c + , puis avec les phages obtenus, on infecte une souche 
a - , b _ , c _ . Si l’examen des phages transduits pour le marqueur a + 
montre que 50 % d’ entre eux porte egalement b + et 2 % c + , on pourra 
interpreter ce resultat comme signifiant que le marqueur a + est plus 
proche de b + que de c + . 

Si maintenant on selectionne les transduits pour le marqueur c + et 
qu’on observe, parmi eux, 3 % contenant a + et aucun b + , cela indique 
que c + est plus proche de a + que de b + . Comme la premiere expe- 
rience montre que b + est plus proche de a + que ne l’est c + , le marqueur 
a + se trouve sur le chromosome bacterien entre b + et c + , mais plus 
proche de b + que de c + . Le principe du raisonnement est base sur le 
fait que plus deux marqueurs sont proches Fun de l’autre, plus ils ont 
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Figure 4.9 Integration du phage X et mecanisme de la transduction specialist. 

Le bacteriophage X s'integre toujours dans la meme region entre gal et bio par crossing- 
over. Les sequences attP contenant les sites specifiques sur I'ADN phagique et attB sur 
le chromosome bacterien contiennent une tres courte region d'homologie qui permet 
la recombinaison. L'induction du prophage entraine I'excision normale de I'ADN du 
phage X. Rarement, le phage X peut s'exciser incorrectement et emporter avec lui un 
fragment d'ADN du chromosome bacterien (go/+ dans le cas present). Les particules 
phagiques ainsi formees sont deficientes car certains genes X sont restes dans le chromo- 
some de I'hote, on les appelle : Xdgal. De la meme fagon, on parle de Xdbio. Cependant, 
il est tout a fait possible d'utiliser ces particules pour transduire une autre bacterie en 
realisant une cotransduction avec un phage X sauvage. 


de chances d’etre cotransduits. L’ etude de plusieurs marqueurs geneti- 
ques permet par cette maniere qui utilise la frequence de recombinaison, 
de cartographier une region du chromosome bacterien, c’est-a-dire 
d’ordonner les marqueurs les uns par rapport aux autres. 
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4.3 TEST DE COMPLEMENTATION 

OU TEST D'ALLELISME FONCTIONNEL 

Avec la decouverte que les genes etaient constitues d’une succession 
de nucleotides organises en double helice, il devint tres clair qu’une 
telle entite pouvait etre definie par un ensemble de sites mutationnels 
detectes au meme locus et engendrant le meme phenotype mutant. 
Cependant, les approches experimentales decrites ci-dessus ne permet- 
taient pas d’etablir les limites d’un gene. Le test qui s’est revele etre un 
bon indicateur des limites d’un gene etait celui de la complementation. 

Les travaux genetiques realises sur le locus rll du phage T4, par 
Benzer (1961), constituent un bon exemple non seulement pour 
comprendre ce test de complementation, mais aussi pour aborder la 
structure fine du gene. Le locus rll du phage T4 est forme de deux 
genes contigus (rll A et rllB) dont les produits regulent la duree du 
cycle du phage. Les plages de lyse produites par le phage sauvage T4, 
lorsqu’on l’inocule sur la souche d’£. coli B, se distinguent facilement 
de celles engendrees par l’infection de la meme souche B, soit par des 
mutants rllA soit par des mutants rllB. Dans le premier cas (phage 
sauvage), on observe la formation de petites plages de lyse alors que 
celles-ci sont nettement plus grandes dans le second cas (phages 
mutants). II existe une autre souche, E. coli K12 (A) sur laquelle seul le 
phage T4 de type sauvage peut se multiplier en produisant d’ailleurs 
le meme phenotype de plages que sur la souche B. En revanche, les 
mutants rll A ou rllB arrivent a injecter leur ADN dans E. coli K12 (A) 
mais ne peuvent pas se reproduire (Fig. 4.10). Par contre, lorsque 
E. coli K12 (A) est infectee simultanement par deux mutants rllA et 
rllB (croisement entre phages), on s’apercoit alors que l’infection est 
suivie de l’apparition, sur un milieu nutritif gelose, d’un grand nombre 
de plages de lyse. Ceci demontre que les genes rllA et rllB assurent 
des fonctions differentes (deux genes differents), chacune necessaire 
a la multiplication sur E. coli K12 (A). De fa?on plus generale, cette 
experience indique que deux genomes reunis dans une meme cellule 
peuvent se complementer l’un l’autre lorsqu’ils sont mutes dans des 
genes differents (le verbe complementer est un neologisme devenu 
necessaire en genetique). Ceci constitue un test de complementation. Par 
exemple, lors de l’infection par le seul mutant rllB , le produit du gene 
rll A est synthetise et fonctionnel mais V absence du produit fonctionnel 
du gene rllB empeche le developpement du phage. De la meme maniere, 
quand on infecte par le seul mutant rllA, la fonction du produit du 
gene rllB est assuree mais elle est insuffisante pour le developpement 
du phage en l’absence de la fonction du gene rllA (Fig. 4.10). 
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Figure 4.10 Representation schematique du test de complementation pour 
I'etudedu locus r//chez le phageT4. 

a) Infection par un mutant rllA ; b) Infection par un mutant rllB ; c) Infection mixte par 
les deux mutants rllA et rllB, il y alors complementation et production de particules 
phagiques, les deux genes sauvages fonctionnels rllA et rllB etant presents dans la 
meme bacterie. Dans tous ies cas, i'ADN bacterien n'est pas represente. 


Jusqu’aux annees 1940, le test de complementation a ete largement 
pratique, notamment pour savoir si deux mutants ayant le meme 
phenotype et obtenus independamment etaient affectes dans la meme 
fonction (meme gene) ou dans des fonctions differentes (deux genes 
differents) sans les connaitre obligatoirement. S’il y avait une comple- 
mentation entre les deux mutations reunies dans une cellule (pheno- 
type sauvage), on concluait que les deux mutations affectaient deux 
genes differents. Au contraire, s’il n’y avait pas de complementation 
(phenotype mutant), on concluait que le phenotype observe, obtenu 
independamment, etait du a la mutation d’un meme gene. Ainsi 
1’ absence de complementation revelee par ce test genetique est une 
preuve d’allelisme qui indique que les mutations sont localisees dans 
les limites d’un gene mais cette preuve ne renseigne pas sur la locali- 
sation des mutations les unes par rapport aux autres a l’interieur d’un 
gene : elles peuvent occuper exactement le meme emplacement ou, 
frequemment, des emplacements differents. 
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4.4 TEST D'ALLELISME STRUCTURAL 

Lorsqu’on s’est apercu que la recombinaison, longtemps consideree 
comme n’ayant lieu qu’entre deux genes, pouvait avoir lieu a l’interieur 
meme d’un gene, l’ancien test de complementation fut remplace par 
deux tests. Le test d’allelisme fonctionnel ou test de complementation 
indique si deux mutations appartiennent ou non au meme gene, c’est- 
a-dire si elles sont ou non alleliques. Le test d’allelisme structural 
revele que des mutations appartenant au meme gene, done alleliques, ne 
complementent pas mais peuvent cependant subir une recombinaison. 

La preuve sans equivoque que la recombinaison peut avoir lieu a 
l’interieur meme d’un gene a ete fournie par 1’ etude des genes rllA et 
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Figure 4.1 la La selection de recombinants intrageniques du gene rllA du phageT4. 

Deux mutants du meme gene rllA (rllAI et rllA2) sont utilises apres leurdeveloppement 
separe dans £ coli B pour infecter la souche E. coli K12 (X). Ces infections simples ne 
revelent aucun developpement phagique sur E. coli K12 ft). 
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Figure 4.1 1 b Selection de recombinants intrageniques du gene rllA du phageT4. 

Deux mutants du meme gene rllA ( rllAl et rllA2) sont mis ensemble en contact de la 
bacterie apres leur developpement simultane dans E. coli B (obtention de recombinants 
sauvages potentiels). Les phages obtenus sont utilises pour infecter E. coli K12 (k). On 
constate I'apparition de quelques plages de lyse qui temoignent d'une recombinaison 
intragenique entre les deux alleles mutes reconstituant le gene rllA sauvage. L'infection 
par les simples mutants rllAl ou rllB tout comme par les doubles mutants ne revelent 
aucun developpement phagique sur E. coliK12 (A.) 
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rllB du bacteriophage T4 en utilisant le test d’allelisme structural 
(Fig. 4.11). La cotransfection de la souche d’£. coli B par deux mutants 
ill A / et rIIA2 permet d’obtenir un lysat de particules phagiques. La 
raise en evidence d’une recombinaison intragenique (a l’interieur du 
meme gene) lors de cette cotransfection est basee sur V infection de la 
bacterie E. coli K12 (X) avec les phages produits par la souche B. En 
effet, seuls des recombinants ayant acquis le type sauvage peuvent se 
developper sur E. coli K12 (X). Dans cette experience, on obtient 
quelques plages de lyse (phages sauvages) pour un grand nombre 
de croisements testes, au contraire du resultat obtenu lors du test de 
complementation. Cette experience a permis de montrer 1’ apparition 
de phages de type sauvage en croisant deux phages mutes au niveau 
d’un meme gene ce qui confirme que la recombinaison est tout a fait 
possible a l’interieur d'un meme gene. On parle de recombinaison 
intragenique (Fig. 4.11). L’ etude d’un grand nombre de mutants des 
genes rllA et rllB revele un large eventail de frequences de recombi- 
naison intragenique. Cette gamme de valeurs indique que certaines 
mutations peuvent etre plus ou moins rapprochees, ce qui permet de 
construire une carte genetique precise et de definir une structure fine 
pour chacun des genes. 


4.5 GENETIQUE DE LA LEVURE 

Cet eucaryote unicellulaire presente un cycle de reproduction haplo- 
diplobiontique (Fig. 4.12), tout a fait interessant pour les geneticiens. 

Ainsi, de tres nombreux mutants ont ete obtenus avec la levure 
Saccharomyces cerevisiae dont les etapes du cycle de reproduction 
sont totalement controlees au laboratoire par les geneticiens. Des 
mutants affectes dans le cycle cellulaire ont pu etre isoles chez la 
levure. Bien evidemment, les genes intervenant dans le cycle cellulaire 
sont des genes essentiels ou indispensables, il a done ete necessaire de 
caracteriser des mutants conditionnels qui presentent un phenotype 
sauvage viable dans des conditions dites permissives et un phenotype 
mute letal dans des conditions dites non permissives. Les geneticiens 
ont eu l’idee de rechercher des mutants thermosensibles (ts). A tempe- 
rature permissive (20 °C), les levures presentent un phenotype sauvage, 
elles se divisent. A temperature non permissive (37 °C), elles presentent 
un phenotype mutant, elles ne se divisent pas. 

Les mutations qui augmentent ou diminuent la fonction du produit 
d’un gene sont extremement utiles pour l’etude d’un systeme cellulaire. 
L’ effet de la mutation (phenotype) donne des indications sur la proteine 
elle-meme et sur la voie dans laquelle elle agit. 
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Figure 4.12 Cycle de reproduction haplodiplobiontiquede la levur e Saccharomyces 
cerevisiae. 

La levure peut proliferer par reproduction vegetative, en se divisant par bourgeonnement, 
aussi bien a I'etat haploide qu'a I'etat diploide. Le passage a I'etat diploide s'effectue 
par fusion de deux cellules haploides de signes sexuels opposes (a et a). Une cellule 
diploide peut subir la meiose et donner 4 spores, qui apres germination donneront 
2 colonies haploides de signe sexuel a et 2 colonies haploides de signe sexuel a. 


Les mutants peuvent etre obtenus par : 

> mutagenese au hasard (agents mutagenes), elle a pour but de det- 
une fonction a un ou plusieurs genes. En general, on cible le genome 
dans son entier ; 

> mutagenese in vitro sur un gene donne afin d’identifier les domaines 
fonctionnels d’une proteine ; 

> mutagenese ciblee, un gene est specifiquement inactive ou altere 
(voir p. 116 ). 

Apres avoir identifie les differents mutants, leur caracterisation 
s’effectue par : 

> l’etude phenotypique detaillee avec d’eventuels cribles secondaires ; 
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>- la determination du caractere dominant ou recessif de la mutation ; 

> la verification du nombre de mutations liees au phenotype (segre- 
gation 2/2 de la mutation apres croisement avec la souche parentale) ; 

> on categorise les mutants par groupes de complementation. 

Les groupes de complementation 
et denombrement des genes 

La genetique de la levure est essentiellement basee sur la possibility 
de croiser deux souches haploides portant des mutations differentes 
pour former une souche diploide. L’ induction de la sporulation du 
diploide peimettra l’obtention d’une tetrade dont les spores isolees par 
dissection avec un micromanipulateur formeront chacune une colonie. 
Par le passe, ces croisements ont permis d’etablir les cartes chromoso- 
miques en utilisant la frequence de recombinaison entre deux mutations 
comme mesure de la distance genetique. Les croisements sont utilises 
aujourd'hui pour generer des souches avec de nouvelles combinaisons 
de mutations et pour analyser les relations genetiques entre differentes 
mutations. 

L’ analyse genetique d’une voie metabolique ou physiologique 
consiste a denombrer le nombre de genes impliques dans celle-ci, a 
identifier la fonction biochimique pour chacun d’eux, voire leurs inter- 
actions eventuelles, etc. En obtenant le maximum de mutants pour une 
voie etudiee, on s’ assure de « toucher » tous les genes impliques dans 
cette voie, a l’exception des genes dont la mutation serait letale. En 
croisant entre eux tous les mutants recessifs, on construit des groupes 
de complementation. Un groupe de complementation est constitue d’un 
ensemble de mutants ne complementant pas entre eux et qui de ce fait 
ont le meme gene mute. Ainsi, si : 

> les deux mutations sont dans le meme gene, la souche diploide aura 
le meme phenotype mutant que les haploides ; 

> les deux mutations sont dans deux genes differents, le diploide aura 
un phenotype sauvage, chaque haploide apportant une copie de 
1’ autre gene sauvage. 

Le nombre de groupes de complementation obtenu par 1’ analyse 
fonctionnelle des croisements entre les divers mutants de la voie 
etudiee indique le nombre minimal de genes impliques dans cette voie 
(Fig. 4.13). 
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Figure 4.13 Determination du nombre de groupes de complementation et par 
analogie du nombre minimal de genes impliques dans une voie metabolique (a). 
Les differents mutants sont croises entre eux et avec un haploide sauvage. Les 
diploides obtenus sont mis en culture, les resultats obtenus sont reportes dans le 
tableau (b).On observe trois groupes de complementation (c),on peut en condure 
qu'au moins trois genes differents sont impliques dans cette voie de biosynthese. 
(-) pas de complementation, done probablement les mutations sont dans le meme 
gene pour les deux mutants ; (+) complementation, done les mutations affectent 
deux genes distincts. 


Invalidation de genes chez la levure 

L’ invalidation de genes est basee sur la disorganisation selective 
d’un gene. Chez la levure, cette technique est facilitee, par la relative 
frequence de la recombinaison homologue. De plus, son cycle de 
reproduction haplodiplobiontique offre la possibilite de travailler sur des 
souches haploides, ce qui ne necessite pas l’obtention d’une invalidation 
homozygote. Chez la levure, cette technique permet entre autres de 
classer les nouveaux genes en deux categories. Par V analyse genetique 
d’une souche diploide ou l’invalidation du gene etudie est a l’etat 
heterozygote (Fig. 4.14), on peut determiner si le gene en question est 
essentiel a la viabilite ou non. 

De la meme maniere on peut introduire un gene X au locus du gene 
URA3 qui sera alors invalide. L’invalidation du gene URA3 qui code 
l’oritidine5’ -phosphate decarboxylase, enzyme impliquee dans la 
synthese de l’uracile (Ura3), permet de contre-selectionner le marqueur 
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Figure 4.14 Invalidation de gene chez la levure. 

En a, dans une premiere serie d'experimentations, le gene est invalide en le remplapant 
par un marqueur de selection (id, URA3). Puis I'integration au genome de la levure est 
effectuee par une recombinaison homologue, basee sur un double crossing-over. En b, 
I'analyse genetique de la descendance de la souche de levure heterozygote pour 
I'invalidation montre, suivant le cas, si le gene invalide est essentiel ou non. S'il est 
essentiel, les 2 spores haploides contenant le gene invalide ne torment pas de colonies. 

URA3 en presence d’acide 5-fluoro-orotique (FOA) qui est converti 
par Ura3 en 5-fluorouracil, toxique pour la cellule. Les cellules URA3 + 
sont done tuees en presence de 5 -FOA tandis que les cellules ay ant 
integre le gene X sont de phenotype ura3 et ont acquis la resistance a 
la FOA. 
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Les levures eucaryotes modeles et outils 

Les levures sont considerees comme des organismes modeles. On 
anticipe qu’une partie au moins des systemes cellulaires fonctionne 
de fagon similaire chez la levure et chez rhomme et par extension chez 
tous les eucaryotes. Ceci est vrai et de nombreux processus mis en 
evidence ou etudies chez la levure se sont reveles en partie conserves 
chez les mammiferes bien qu’avec des niveaux de complexite plus 
eleves comme : 

> la regulation du cycle cellulaire ; 

> la transmission des signaux extracellulaires ; 

> les regulations de 1’ expression des genes ; 

> le trafic intracellulaire ; 

> le vieillissement. . . 

Pour le vieillissement, on a pu etablir un parallele entre la duree de 
vie predetermine de la cellule mere qui meurt apres 40 a 50 generations 
et celle de la plupart des cellules d’eucaryotes superieurs et identifies 
des genes impliques dans le vieillissement. Par exemple, des mutations 
du gene, WRN (Werner’s syndrom) chez 1’homme et de son homologue 
SGS1 chez la levure provoquent des senescences precoces. La collection 
de mutants de levure a ete mise a profit pour le clonage de genes hetero- 
logues, et ainsi de nombreux genes de mammiferes ou de plantes ont 
ete clones par complementation de mutants de levure (voir dans la 
meme collection l’ouvrage Biologie moleculaire). 

4.6 MICRO-ORGANISMES ET GENIE GENETIQUE 

La technologie de V ADN recombinant utilisant differentes cellules hotes 
a permis la biosynthese de grandes quantites de proteines d’interet 
comme des proteines humaines qui n’etaient jusque la disponibles qu’en 


Figure 4.1 5 Production d'insuline recombinante humaine par E. coli. > 

L'insuline est composee de deux sous-unites a et p. Chacune d'elles est produite 
separement. Dans un vecteur depression, portant un marqueur de selection, le 
gene de resistance a I'ampicilline ( Ampr ) on introduit la sequence codant I'une ou 
I'autre des chaines en aval du gene tacZplace sous la dependance de promoteur 
bacterien. Les bacteries sont transformees et mises en culture sur un milieu 
contenant de I'ampicilline. Les clones resistants a I'ampicilline sont utilises pour 
une culture en masse. La proteine chimerique Lac-Z sera synthetisee dans les 
bacteries. Apres arret de la culture les bacteries sont lysees et les proteines purifiees. 
Le clivage des proteines chimeriques s'effectue par traitement au bromure de 
cyanogene qui rompt la liaison peptidique entre la methionine de LacZ et la phenyl- 
alanine porte par la chaine d'insuline. Les chaines a et p sont purifiees, se replient et 
des ponts disulfure s'etablissent entre les cysteines portees par les deux sous-unites. 
La molecule d'insuline est active et peut etre injectee pour traiter des diabetes de type I. 
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tres petites quantites. La premiere proteine qui fut exprimee est la 
somatostatine, un peptide neurotransmetteur de 14 acides amines. 
Depuis, de nombreuses proteines recombinantes ont vu le jour avec 
comme application premiere le traitement de maladies immuno- 
logiques, neurologiques, infectieuses, genetiques, etc. Un des succes de 
la technique est la fabrication de vaccins contre les maladies infectieuses. 
Elle consiste a produire la proteine de surface du pathogene qui servira 
alors d’antigene. Le premier vaccin reussi est celui de l’hepatite B, la 
proteine immunogene etant produite chez la levure. Des molecules 
recombinantes sont meme retrouvees dans des compositions de deter- 
gents et de produits alimentaires. 

La strategie generate de production de ces differentes molecules 
consiste a cloner le gene d’interet dans un vecteur, appele vecteur 
d’expression, qui est ensuite transfere dans une cellule qui peut assurer 
son expression. Les vecteurs derivent des plasmides presents naturel- 
lement dans les bacteries et les levures. Les systemes d’expression 
les plus utilises sont procaryotes, E. coli et B. subtilis, et eucaryotes, 
levures, cellules d’insectes et cellules de mammiferes. Les procaryotes 
ne sont pas souvent de bons candidats pour la production de proteines 
humaines notamment quand celles ci necessitent des modifications 
post-traductionnelles pour etre actives. 

Generalement, les molecules recombinantes sont produites soit 
pour augmenter la quantite d’une molecule deja existante et extraite 
de tissus animaux. L’insuline par exemple etait purifiee a partir de 
pancreas de pores sacrifies a V abattoir. La premiere insuline recombi- 
nante humaine est apparue sur le marche pharmaceutique en 1982. 
Cette insuline a pu etre produite a l’echelle industrielle, et a des couts 
moindres grace a Lutilisation de bacteries et des techniques de l’ADN 
recombinant (Fig. 4.15). Elle permet de traiter les patients atteints de 
diabetes de type 1. Depuis un grand nombre de « proteines medica- 
ments » sont produites par des bacteries comme des hormones de 
croissance, E interferon, des interleukines, etc. 

Le genie genetique permet d’obtenir aussi des proteines dont la 
structure naturelle est modifiee afin d’ameliorer ou de modifier leur 
fonction. A titre d’exemple, la subtilisine, protease a serine utilisee 
dans les detergents, est sensible aux autres produits employes dans le 
blanchiment a cause de l’oxydation de la methionine 222. Par muta- 
genese dirigee, plusieurs formes mutees de la subtilisine ont ete 
produites ou la methionine a ete remplacee par d’autres acides amines. 
II a ete ainsi possible de selectionner un mutant (possedant 1’ alanine 222) 
moins actif que le sauvage mais insensible a l’oxydation. 
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POINTS CLEFS 


>- Les procaryotes ne possedent pas de noyau. Leurs genes sont regroupes 
essentiellement sur un seul chromosome circulaire. 

>- Les plasmides, structures de petite taille, portent des genes, tels les genes 
de resistance a des agents chimiques, qui fournissent a la bacterie la possi- 
bility de vivre et se multiplier dans un environnement defavorable. 

>- Toutes les bacteries d'une colonie isolee sur une boite sont issues d'une seule 
cellule, elles ont done toutes le meme materiel genetique et constituent 
un clone. 

>- Lors de la conjugaison bacterienne, le transfert d'ADN est unidirectionnel 
de la bacterie donneuse vers la bacterie receveuse. 

> Au cours de la conjugaison, un contact physique s'etablit entre les deux 
bacteries grace notamment a Taction de pili sexuels codes par le facteur F. 

>- Le facteur F est un plasmide qui peut s'integrer dans le chromosome 
bacterien, la bacterie est alors nommee Hfr pour Haute frequence de 
recombinaison. 

>- L'origine et la direction du transfert sont determinees par la meme extre- 
mity du facteur F, appelee origine de transfert. Lors de la conjugaison d'une 
bacterie Hfr avec une bacterie F', I'information genetique du facteur F sera 
toujours transferee en dernier lieu apres transfert de tout le chromosome 
de la souche Hfr. 

>- Par des experiences de conjugaison bacterienne interrompue, on a pu faire 
la cartographie du chromosome bacterien. 

>- Les vecteurs transportant les multiples resistances d'une cellule a une autre 
appartiennent a un groupe de plasmides, les plasmides R. 

>- Le mecanisme par lequel une bacterie absorbe de I'ADN exogene a partir de 
son environnement et I'integre de fagon fonctionnelle dans son chromosome 
est appele transformation. 

>- La capacity qu'ont les bacteries a absorber naturellement des fragments 
d'ADN exogene en solution, processus nomme competence naturelle, est 
genetiquement definie. 

>- Les bacteriophages (ou phages) sont des virus qui infectent les bacteries. 

>- Un prophage est constitue par I'ADN d'un phage a I'etat integre dans le 
chromosome de I'hote bacterien. 

>- De courtes sequences d'ADN bacterien peuvent etre transmise de fagon 
passive d'une bacterie a une autre par I'intermediaire d'un bacteriophage. 
C'est la transduction. 
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> Certains phages transducteurs ne transportent qu'une partie restreinte et 
bien determinee du chromosome bacterien du fait d'une insertion du 
transducteur en une position precise du chromosome bacterien. Ce pheno- 
mene est appele transduction specialist. 

>- Le test d'allelisme fonctionnel ou test de complementation indique si deux 
mutations appartiennent ou non au meme gene, c'est-a-dire si elles sont 
ou non alleliques. 

>- Les mutants conditionnels presentent un phenotype sauvage viable dans 
des conditions dites permissives et un phenotype mute letal dans des 
conditions dites non permissives. 

>- Un groupe de complementation est constitue d'un ensemble de mutants 
ne complementant pas entre eux et qui de ce fait ont le meme gene mute. 

>- L'invalidation de genes est basee sur la disorganisation selective d'un gene. 

>- Les levures sont considerees comme des organismes modeles. Une partie 
au moins des systemes cellulaires fonctionne de fagon similaire chez la 
levure et chez tous les eucaryotes. 

>- La production de proteines recombinantes s'effectue par insertion de la 
sequence codant la proteine d'interet dans un vecteur d'expression qui 
est ensuite transfere dans une cellule competente qui peut assurer son 
expression. 


QCM - QROC 

6.1 Quelle est la bonne affirmation ? 

a) Les genes bacteriens sont portes par un seul chromosome lineaire. 

b) Les bacteries gal~ utilisent le galactose comme source de carbone. 

c) Les genes de resistances aux antibiotiques sont utilises comme 
marqueurs. 

d) L’auxotrophie correspond a la capacite d’une bacterie a proliferer 
sur milieu minimum. 

6.2 Quelles propositions sont exactes : 

a) Le facteur F n’est pas integre dans le chromosome d’une bacterie 
Hfr. 

b) Les pili sexuels relient deux bacteries F + lors de la conjugaison. 

c) Le transfert d’ADN d’une bacterie FIfr vers une bacterie F _ est 
unidirectionnel. 

d) C’est sous la forme monobrin que l’ADN est transfere lors de la 
conjugaison. 


Reponses 
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e) L’ADN transfere a la bacterie F _ s’integre de fagon aleatoire dans 
son chromosome. 

6.3 En quoi la transduction differe de la transfonnation ? 

6.4 Le phage dans le cas de la transduction specialisee : 

a) emporte des regions specifiques du genome bacterien ; 

b) encapside la totalite de son ADN ; 

c) porte le nom du gene bacterien qu’il a emporte ; 

d) ne peut integrer son ADN au chromosome de l’hote que s’il y a une 
double infection necessitant la presence d’une particule phagique 
normale. 

6.5 Peut-il y avoir recombinaison entre les genomes des virus bacteriens ? 

6.6 Quelle est la bonne proposition : 

a) Un groupe de complementation est defini comme un ensemble de 
mutants qui n’ont pas les memes genes mutes. 

b) Le nombre de groupes de complementation obtenu apres croisement 
des mutants entre eux permet de definir le nombre maximum de genes 
presents dans une voie metabolique etudiee. 

c) Chez la levure le croisement de mutants ayant chacun une mutation 
recessive donnera un phenotype sauvage au diploide heterozygote. 

d) Si les deux mutations sont dans le meme gene, le diploide aura le 
meme phenotype mutant que les haploides. 

6.7 Chez E. coli, 3 souches Hfr, derivees de la meme souche F + , trans- 
ferent une serie de marqueurs dans l’ordre suivant : 

- Hfrl : ACBDF ; 

- Hfr2 : LKJFD ; 

- Hfr3 : SEMLK. 

Donner l’ordre des marqueurs sur le chromosome circulaire de la 
bacterie F + dont derivent les 3 souches Hfr. 

6.8 Un bacteriophage possede les genes dans l’ordre suivant : gl, g2, 
g3, g4, g5, g6, g7 et g8 ; alors que le son prophage les a dans un autre 
ordre g6, g7, g8, gl, g2, g3, g4 et g5. Quelle information vous apporte 
cette permutation ? 


REPONSES 


6.1 c) Vraie ; faux : a) le chi'omosome est circulaire, b) la bacterie ne 
metabolise pas le galactose, d) l’auxotrophie traduit l’incapacite a 
synthetiser des metabolites qui doivent etre ajoutes au milieu de culture. 
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6.2 c) et d) vraies ; faux a) le facteur F est integre au chromosome de la 
bacterie Hfr, b) ils relient les bacteries Hfr ou F + a une bacterie F _ , 
e) l’ADN s’integre par recombinaison homologue. 

6.3 Les phages servent d’intermediaire pour le transfert d’ ADN d’une 
bacterie a une autre ; la transformation concerne des fragments 
d’ADN libre dans le milieu. 

6.4 a), c) et d) vraies, b) faux, l’intermediaire en boucle qui se forme 
entraine une excision erronee, certains genes phagiques restent dans 
le chromosome bacterien. 

6.5 Oui, si deux types de phages legerement differents infectent 
simultanement une bacterie hote (voir figure 4.11b). 

6.6 c) Vraie ; faux a) un groupe de complementation est defini comme 
un ensemble de mutants qui ont le meme gene mute, b) de definir le 
nombre minimum de genes presents dans une voie metabolique, d) si 
les deux mutations sont dans le meme gene, mais suffisamment distantes, 
il peut y avoir recombinaison homologue qui aboutira a un allele 
sauvage et un allele portant les deux mutations. 

6.7 Le l er marqueur a etre transmis est le plus proche de l’origine de 
transfert dont l’orientation impose egalement le sens du transfert. Ainsi, 
la souche Hfrl transfere en premier le marqueur A puis les autres 
marqueurs ; la souche Hfr2 transfere elle en premier le marqueur L. 
On constate que F et D sont communs aux deux souches, mais dans 
un ordre inverse. Done, pour la souche FIfr2, l’origine de transfert est 
inversee par rapport a Hfr 1 . On observe egalement une inversion des 
marqueurs communs L et K transmis par FIfr 2 et 3. En orientant les 
sequences de ces 2 souches par rapport a Hfrl , F ordre des marqueurs 
sur la souche d’origine est : ACBDFJKLMES. 

6.8 On en deduit la position du site d’attachement Att qui permet 
F integration de F ADN phagique par recombinaison homologue. 11 se 
situe entre les genes g5 et g6. 
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5.1 Expression des genes : la transcription de I'ADN 

5.2 Expression des genes : I'epissage alternatif des transcrits 

5.3 Expression des genes : regulation traductionnelle 

5.4 Regulations epigenetiques de I'expression des genes 

5.5 Les reseaux de regulation de I'expression des genes 

> Etudier les differents aspects de I'expression des genes 

> Accorder une attention speciale aux modifications epigenetiques 
>- Aborder certains aspects lies aux analyses a grande echelle 

> Aborder les aspects integres de la genetique et des autres disciplines de la 
biologie 


On designe par le terme « expression des genes » le processus mole- 
culaire et cellulaire qui consiste a convertir la sequence ADN des genes 
en proteines fonctionnelles. Les differentes etapes de ce processus 
sont modulables depuis l’etape de la transcription de I’ADN en ARN 
jusqu’aux modifications post-traductionnelles des proteines. On designe 
habituellement ces modulations par le concept de « regulation des 
genes ». II est a la base de la comprehension du fonctionnement courant 
des cellules et organismes. Les mecanismes mis en jeu dans cette 
regulation sont egalement la cible de changements mutationnels dont 
les effets se manifestent a la fois dans le controle du metabolisme et 
dans 1’evolution des etres vivants. 

5.1 EXPRESSION DES GENES : LA TRANSCRIPTION DE L'ADN 

Les proteines necessaires a la transcription 

Les mecanismes de la transcription reposent sur l’activite d’une famille 
d’enzymes, les ARN polymerases, qui realisent le meme type de reaction 
(une synthese d’ARN a partir d’une matrice d’ADN) quelle que soit 
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la cellule procaryote ou eucaryote consideree. Les ARN polymerases se 
fixent a des regions de 1’ ADN designees sous le terme de promoteurs, 
souvent avec l’aide de proteines additionnelles. Elies catalysent ensuite 
par differentes etapes bien definies la polymerisation des ribonucleotides 
triphosphates precurseurs en un polynucleotide monocatenaire dont la 
sequence est complementaire du brin d’ADN ay ant servi de matrice 
modele (brin transcrit). L’ autre brin d’ADN qui n’est pas transcrit est 
dit parfois brin codant car il possede une sequence identique a celle 
du transcrit d’ARN. Les ARN polymerases adoptent une structure 
tridimentionnelle en forme de pince ce qui leur permet d’enserrer le 
brin d’ADN (oriente dans le sens 3’ -> 5’) et en coulissant de le trans- 
crire en un ARN oriente dans le sens 5’ -> 3’. Bien que le mecanisme 
general chez les eucaryotes s’apparente a celui des procaryotes, il s’en 
distingue cependant par une intervention beaucoup plus complexe 
de nombreux facteurs de transcription indispensables a la formation 
specifique de 1’ association entre ARN polymerases et promoteurs et 
au demarrage efficace de la transcription. On distingue a cet effet les 
facteurs generaux de la transcription, suffisants pour reconstituer le 
processus in vitro, et les facteurs additionnels organises en complexes 
mediateurs indispensables a la transcription in vivo. 

Les ARN polymerases s’attachent aux promoteurs de faqon faiblement 
spontanee et la transcription peu active, constitutive, qui en resulte se 
situe a un niveau basal. Un represseur occupant un operateur, c’est- 
a-dire un site chevauchant le promoteur sera alors suffisant pour inhiber 
la transcription. A l’inverse, un activateur occupant son site souvent a 
proximite du promoteur aidera la fixation de la polymerase (Fig. 5.1). 
Ce recrutement de 1’ enzyme par un activateur est un bon exemple de 
cooperation entre proteines dans la realisation d’une fonction molecu- 
laire elementaire : ici le demarrage de la transcription. La regulation 
de l’operon lactose (voir plus loin) se rattache a ce type de mecanisme. 


Promoteur 



Figure 5.1 Schema illustrant le role d'un activateur dans le recrutement d'une 
ARN polymerase a son promoteur. 

Lorsque le represseur occupe son site, il exclut par competition I'enzyme de son 
promoteur. 
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Au cours de la transcription et avant meme que 1’ ARN ne soit exporte 
hors du noyau de la cellule eucaryote pour etre ensuite traduit (dans le 
cas d’un ARNm), il subit une serie de modifications qui concourent a 
la production a partir du transcrit primaire d’un ARN dit mature, apte 
a assurer les fonctions auxquelles il est destine. Dans Fordre ou elles 
interviennent on distingue pour les ARNm : l’addition d’une coiffe a 
l’extremite 5’, l’epissage des introns et l’addition d’une queue de 
polyadenylation a l’extremite 3’. 

L'exemple historique de I'operon lactose de E. Coli 

L’operon lactose comporte trois genes adjacents denommes lacZ, 
lacY et lacA (Fig 5.2). Le premier code la (3-galactosidase, une enzyme 
qui hydrolyse le lactose en glucose et galactose, deux oses utilises par 
la cellule pour ses besoins energetiques ; lacY code une permease 
membranaire qui importe le lactose dans la cellule ; lacA code une 
transacetylase qui purge la cellule des thiogalactosides toxiques intro- 
duits par la permease. Un seul ARN messager polycistronique, transcrit 
a partir du promoteur situe en amont du gene lacZ, fournit par traduction 
les trois proteines. Elles sont produites seulement quand le lactose est 
disponible (on dit que le lactose agit comme un inducteur) et que le 
glucose est absent. 



Figure 5.2 Positionnement des divers partenaires fonctionnels de I'operon lac. 

La transcription des genes lacZ, lacY et lacA n'est effective que lorsque le lactose est 
present c'est-a-dire lorsque le represseur est inactif et I'operateur inoccupe. La proteine 
CAP complexee a I'AMPc stimule le recrutement de la polymerase uniquement en 
I'absencedu glucose. 
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En presence de glucose, la bacterie utilise preferentiellement cet ose 
pour ses besoins metaboliques en energie et en composes carbones. Si 
de plus le lactose est absent, le represseur Lac reprimera fortement la 
transcription de Eoperon lac. Les quantites de (i-galactosidase et des 
deux autres proteines sont produites a un niveau basal, soit environ 
5 molecules par cellule. En presence du lactose et en 1’ absence du 
glucose, le represseur devient inactif et la transcription de Eoperon lac 
est dereprimee. Mais la proteine CAP activera l’operon lac seulement 
en l’absence du glucose. On peut denombrer jusqu’a 5 000 molecules 
de (i-galactosidase par cellule lorsque l’operon est pleinement actif. 

Le represseur Lac et la proteine CAP sont deux exemples de proteines 
liant E ADN en des sites specihques et uniques par leurs sequences en 
bases. Le site de l’operateur lac, reconnu par le represseur Lac, est une 
sequence partiellement palindromique de 21 paires de bases repetees 
et inversees, a double symetrie. 

Chacune des deux sous-unites du represseur comporte une structure 
spatiale tres conservee par beaucoup de proteines liant E ADN. Elle se 
compose de deux helices a qui sont separees par une boucle. Ce motif 
nomme helice-tour-helice s’attache a un demi-site de l’operateur par 
l’une des helices (l’helice de reconnaissance) qui s’engage dans le 
grand sillon de l’ADN a l’aplomb de la sequence correspondante. La 
reconnaissance specihque entre l’helice proteique et la sequence en 
bases de l’ADN met en jeu des liaisons hydrogene et des interactions 
electrostatiques qui stabilisent la fixation de l’helice au demi-site de 
l’operateur lac (Fig. 5.3). 

La sequence de ce dernier chevauche la sequence du promoteur et 
lorsque le represseur est present, il empeche EARN polymerase de se 
fixer et inhibe la transcription de Eoperon lac. Le contact entre la 
proteine CAP et son site d’attachement a l’ADN obeit a ces memes 
principes structuraux. On note la presence d’un motif helice-tour- 
helice et des interactions basees sur des liaisons faibles et nombreuses 
entre les amino-acides de l’helice engagee dans le grand sillon et les 
bases de l’ADN. L’ action activatrice de la proteine CAP s’exerce par 
une interaction directe entre une region de la proteine (le domaine 
activateur) et le domaine carboxy-terminal de la polymerase. Le 
promoteur lac ne possede pas en effet d’element UP (voir le Mini 
Manuel de Biologie moleculaire ) et de ce fait, EARN polymerase s’y 
attache faiblement. On dit que le promoteur lac est un promoteur 
naturellement faible. Lorsque le site CAP est occupe par la proteine 
CAP, celle-ci recrute activement par son domaine d’interaction EARN 
polymerase et stimule ainsi la transcription. 
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Domaine de 
fixation de la 
proteine CAP 


lllllllll 




Region occupee par 
I’ARN polymerase 


1 Operateur 

+1 Region occupee par 



AATTGTGAGC G GATAACAATT 
TTAACACTCG C CTATTGTTAA 


demi-site demi-site 



Figure 5.3 Organisation sommaire de la region de controle de Poperon lac 
montrant les sequences d'ADN occupees par les proteines regulatrices et I'ARN 
polymerase. La structure palindromique en demi-sites de I'operon lac est detaillee. 
L'interaction du represseur Lac sous sa forme dimerique montre le positionnement 
des helices dans le grand sillon de I'ADN. 


Une meme proteine regulatrice peut etre repressive 
ou activatrice 

La proteine « represseur » du bacteriophage X, nominee le represseur X, 
est codee par le gene cl (Fig. 5.4). Malgre son nom, cette proteine qui 
possede deux domaines, un domaine de liaison a I’ADN couvrant 17 pb 
et un domaine d’activite, peut activer ou reprimer la transcription. Elle 
existe habituellement sous la forme d’un dirnere. Lorsqu’elle reprime, 
elle fonctionne comme le represseur Lac et se fixe a un operateur 
chevauchant le promoteur excluant ainsi I'ARN polymerase. Lorsqu’elle 
active la transcription, elle fonctionne comme la proteine CAP et 
recrute I’ARN polymerase. 
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La proteine Cro (Control of repressor and others things) est codee 
par le gene cro. Elle possede un seul domaine de liaison a l’ADN 
couvrant 17 pb et existe aussi sous la forme d’un dimere. Plus simple 
que le represseur X, elle reprime la transcription comme le fait le 
represseur Lac. 



Aim A 


Induction 


dimere de CRO 



Figure 5.4 Representation schematique de Taction respective du represseur X et 
de la proteine Cro. 

Noter les mecanismes d'autoregulation positive et negative du represseur X. Par I'occu- 
pation cooperative des operateurs 0 R2 et 0 R3 il active ou reprime sa propre synthese a 
partirdePRM. 


Les isolateurs eucaryotes 

Quand un activateur agit a longue distance (parfois a plusieurs milliers 
de kb d’un promoteur) il est inevitable que son action puisse s’exercer 
sur differents promoteurs presents dans l’intervalle. Cet inconvenient 
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semble, chez les eucaryotes, surmonte par la presence de sequences 
d’un type particulier, appelees isolateurs. Places entre un site activateur 
(enhancer) ou un site represseur (silencer) et un promoteur, l’isolateur 
inhibe 1’ activation ou la repression du gene par le stimulateur ou le 
represseur en bloquant la communication entre les deux partenaires. 
II n’empeche pas cependant l’activateur ou le represseur d’agir sur un 
autre gene, ni le gene bloque d’etre active ou inhibe par un autre 
stimulateur ou represseur (Fig. 5.5). Au total un isolateur en ciblant la 
protection d’un gene evite que des evenements d’activation ou de 
repression sur de longues distances puissent alterer le fonctionnement 
du genome. En ce sens, les isolateurs sont des elements plutot specifiques 
des genomes complexes et de grande taille. 





Figure 5.5 Illustration du mode d'action d'un isolateur. 

a) L'isolateur occupe inhibe uniquement I'action de I'activateur sur le gene 1.11 n'interfere 
pas avec I'activation du gene 2 ; b) l'isolateur occupe n'interfere pas avec I'activation 
du gene 1 par un autre activateur (ici I'activateur 2). 
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b) 


Competition 



Site Site 

activateur represseur 


C) 



Figure 5.6 Exemple des principaux modes d'action des repressers eucaryotes. 

a) Les sites de liaisons a I'ADN sont chevauchants et la presence du represseur exdut celle 
de I'activateur ; b) les sites de liaisons sont distincts mais rapproches, le represseur peut 
inhiber par interaction directe I'effet de I'activateur ; c) le represseur occupe son site et 
agit sur la machinerie transcriptionneile par I'intermediaire du complexe mediateur; 
d) le represseur, lie a son site, recrute une histone desacetylase qui en eliminant les 
groupes acetyles des queues d'histones,entraine une modification de la structure des 
nudeosomes et de la chromatine, dont les effets sont inhibiteurs de la transcription. 
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La regulation transcriptionnelle 
a I'echelle de la chromatine 

Contrairement au mode d’ action le plus frequemment rencontre chez 
les bacteries, les represseurs et activateurs eucaryotes n’agissent 
pas, pour inhiber ou stimuler l’attachement des ARN polymerases aux 
promoteurs, par competition et encombrement sterique du site promo- 
teur. Ils peuvent cependant interagir avec les ARN polymerases en se 
liant a des sites adjacents a ceux des promoteurs, de faqon alternative 
ou competitive. Les activateurs et represseurs eucaryotes recrutent 
frequemment des proteines modificatrices de la structure chromatinienne 
(Fig 5.6). 

5.2 EXPRESSION DES GENES : L'EPISSAGE ALTERNATIF 
DES TRANSCRITS 

Genes morceles et epissage des transcrits 

Contrairement aux genes bacteriens dont les sequences codant les pro- 
teines sont continues, la plupart des genes eucaryotes ont une sequence 
organisee en regions codantes (les exons) interrompues par des regions 
non codantes (les introns). On parle de genes en mosaiques, ou de 
genes morceles ou delates. Cependant, cornme les genes bacteriens, ils 
sont transcrits en une copie ARN continue, le transcrit primaire (appele 
aussi pre-ARNm, dans le cas d’un precurseur d’ARNm). Comme le 
systeme cellulaire de traduction en proteines fonctionne d’une maniere 
a lire en continu les codons successifs, les ARN messagers eucaryotes 
sont prealablement debarrasses de leurs introns. Le pre-ARNm est 
converti en ARN messager mature grace a une machine moleculaire, 
le spliceosome, agissant avec une extreme precision sans perte d’un 
seul nucleotide ce qui aurait pour effet de rompre le cadre de lecture 
indispensable a l’obtention d’une proteine conforme a l’information 
genetique initiale. Frequemment l’epissage des introns peut se produire 
de maniere alternative (differentes combinaisons d’ introns sont 
eliminees) et donner naissance pour un meme gene a divers ARN messa- 
gers matures qui tous sont susceptibles de conduire a des proteines 
fonctionnelles mais distinctes. Les differentes proteines resultant de 
la transcription d’un seul gene sont des isoformes proteiques. Elies 
peuvent avoir des fonctions similaires, differentes ou antagonistes. Un 
gene peut donner parfois naissance alternativement a plusieurs trans- 
crits. Certains s’averent parfois improductifs car ils portent un codon 
stop premature qui conduit a une proteine tronquee, non fonctionnelle 
et rapidement degradee. Ce n’est pas toujours le cas. Les diverses 
modalites d’epissage connues sont souvent a l’origine d’une grande 
diversite de proteines fonctionnelles. 
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Figure 5.7 Principales etapes de la reaction d'epissage des introns. 

Noter dans le schema du haut, les sequences consensus des sites d'epissage en bordures 
intron-exon et a I'interieur de I'intron (voir aussi le Mini Manuel de Biologie moleculaire). 
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Epissage alternatif et regulation 
Cas general 

La consequence admise de I’epissage alternatif est de diversifier tres 
sensiblement l’expression des genes eucaryotes, un phenomene qui 
est en accord avec la plus grande complexity des organismes qui les 
possedent. 


a) 


pre-ARNm 5' 


Exon 1 


intron 


site d’epissage 
+ site de fixation 
d’un represseur 


~| Exon 2 


3' 




5' Exon 1 | ~| 1 | Exon 2~ 3' 

Intron non episse 


b) 


pre-ARNm 5' 


Exon 1 


intron 




Site de fixation 
d’un activateur 


Exon 2 



Figure 5.8 Principes generaux de la regulation de I'epissage alternatif montrant 
les roles respectifs des sites d'epissage, du spliceosome, des sites regulateurs de 
I'epissage et des proteines regulatrices.activateurs ou represseurs. 

a) Le represseur masque le site d'epissage et empeche faction du spliceosome ; b) en 
occupant son site, I'activateur favorise le recrutement du spliceosome. 


138 


Chapitre 5 • Expression des genes etdes genomes 


A l’interieur de la sequence du transcrit primaire (pre-ARNm) au 
sein des introns, de courtes sequences consensus delimitent les frontieres 
entre exons et introns (Fig. 5.7). A l’extremite 5’ de l’intron la sequence 
s’appelle « site d’epissage en 5’ » et a l’autre extremite « site d’epissage 
en 3’ ». Une troisieme sequence consensus, le point de branchement, 
se trouve a l’interieur de l’intron plutot du cote 3’ et elle est suivie 
d’une sequence riche en pyrimidines. 

La regulation de l’epissage alternatif ressemble beaucoup a la regu- 
lation transcriptionnelle. L’attachement de la machinerie d’epissage a 
un site d’epissage particulier depend en effet de l’affinite de ce site pour 
la machinerie et de l’action des proteines regulatrices de l’epissage. 
Un site d’epissage puissant favorisera un epissage constitutif. Mais 
un represseur d’epissage peut entrer en competition pour s’attacher a ce 
site et bloquer la machinerie d’epissage. Des sequences stimulatrices 
de l’epissage sont egalement presentes. Elies sont reconnues par des 
proteines regulatrices qui recrutent la machinerie d’epissage. Comme 
pour les proteines regulatrices de la transcription, ces proteines posse- 
dent deux types de domaines, l’un qui s’attache a l’ARN et l’autre qui 
s’attache a la machinerie d’epissage (Fig. 5.8). 

Epissage alternatif et localisation cellulaire 

La regulation de l’epissage alternatif des ARN messagers a pour conse- 
quence principale d’accroitre la diversite des proteines cellulaires et 
d’aboutir a la synthese de proteines differentes selon les types cellu- 
laires consideres. Un meme transcrit pourra ainsi fournir deux ARNm 
matures codant pour deux proteines exercant des fonctions de liaison 
vis-a-vis d’un ligand dans deux localisations cellulaires differentes 
(Fig. 5.9). 

5.3 EXPRESSION DES GENES : REGULATION TRADUCTIONNELLE 

La sequence complete d’un ARNm a generalement une taille superieure 
a la partie qui sera effectivement traduite en sequence proteique. Le 
terme « cadre ouvert de lecture » ou sequence codante (voir plus 
haut) designe le segment d’ARNm qui est traduit (Fig. 5.10). Chaque 
sequence codante est delimitee par un codon de demarrage (tres 
souvent AUG) et un codon de terminaison de la traduction qui est 
l’un des trois codons d’arret, UAG, UGA ou UAA. 

La plupart des ARNm eucaryotes comportent un seul cadre ouvert 
de lecture ; ils sont de ce fait dits monocistroniques. Les ARNm pro- 
caryotes comportent frequemment plusieurs ORL et sont dits pour 
cette raison polycistroniques. Ils codent generalement chez les bacte- 
ries des proteines impliquees dans une meme voie metabolique. Pour 
certains ARNm polycistroniques, le codon d’arret d’un ORL chevauche 
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Figure 5.9 Le transcrit primaire (pre-ARNm) peut subir un epissage alternatif. 

Les deux proteines obtenues possedent le meme domaine C-terminal code par les 
exons 3 et 4 (meme cadre de lecture) mais different dans leurs parties N-terminales qui 
sont codees respectivement par I'exon 1 ou I'exon 2. Les deuxs proteines n'ont pas la 
meme localisation cellulaire. L'une est ancree dans la membrane grace a son domaine 
transmembranaire code par I'exon 1 et exerce une fonction receptrice a I'exterieur de 
la cellule, I'autre est strictement cytoplasmique et ne pourra s'associer qu'a un ligand 
intracellulaire. 
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le codon de dtmarrage de l’ORF suivant dans une sequence 5’-AUGA-3’ 
contenant les deux codons. En regie gtntrale les regions en amont 5’ 
du codon AUG et en aval 3’ du codon d’arret de 1’ ARNm sont cepen- 
dant indispensables a la traduction. Elies sont differemment utilisees 
par les procaryotes et les eucaryotes pour le recrutement des ribosomes 
et des nombreuses proteines necessaires a la traduction. 

Les elements de structure des ARN messagers eucaryotes influengant 
la traduction comportent (Fig. 5.10) : 

> Les structures situees aux deux extremites de l’ARNm : la structure 
en 5’, constitute par la 7-methyl-guanosine triphosphate, appelte 
aussi chapeau (« capping structure ») et la structure en 3’, consti- 
tute d’une stquence additionnelle polyadtnylte ou queue poly A. 
La communication entre ces deux structures est essentielle pour 
1’efficacitt du dtmarrage de la traduction. 

>- Les stquences internes du messager assurant pour le dtmarrage de 
la traduction une entrte des ribosomes (ou IRES) indtpendante de 
l’extrtmitt 5’ (7-mtthyl-guanosine triphosphate) du messager. 

>- Les petits cadres de lecture (uORLs), shuts en amont du cadre 
principal (ou ORE, « open reading frame ») reprtsentt par la stquence 
codante du gene, qui amoindrissent la traduction par avortement 
rtpttt en raison de leur taille. 


5' UTR uORF Cadre de lecture (ORF) 3' UTR Queue polyA 



Figure 5.1 0 Structures des ARNm influengant la traduction. 

L'ARNm eucaryote possede une extremite 5' protegee (CAP) ou se fixe le ribosome 
avant de balayer I'ARN jusqu'au codon de demarrage situe generalement au sein 
d'une sequence dite de Kozack stimulatrice du demarrage tout comme la queue poly- 
adenylee situee a son extremite 3'. Noter la presence de sequence interne d'entree des 
ribosomes (IRES) et de sites specifiques de liaison de proteines ou d'ARN regulateurs. 
START : region contenant le codon de demarrage ; UTR : region non traduite. 
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> Les structures secondaires et tertiaires de l’ARNm, en forme d’epin- 
gles a cheveux ou de noeuds, qui bloquent nomialement la traduction, 
mais peuvent faire partie des IRES et ainsi stimuler une traduction 
independant e de Fextremite 5’. 

> Les sites de liaisons specifiques de complexes proteiques qui sont 
des determinants cruciaux de la traduction. 

La plupart de ces elements et mecanismes regulateurs sont en fait 
inhibiteurs de la traduction. Cela signifie que les ARNm d’une cellule 
eucaryote, loin d’etre systematiquement traduits, une fois transcrits et 
matures, se distribuent en deux ensembles d’inegale importance. Le 
premier, minoritaire, comporte a la fois un petit nombre d’ARNm 
activement traduits et les ARNm qui bien que non reprimes sont en 
attente de la disponibilite des facteurs de demarrage. Le deuxieme, 
comporte tous les ARNm reprimes par Fun ou F autre des mecanismes 
cites ci-dessus. 

5.4 REGULATIONS EPIGENETIQUES DE L'EXPRESSION 
DES GENES 

L’heredite epigenetique repose sur la transmission d’une information 
qui n’est pas codee dans la sequence de F ADN bien qu’elle soit trans- 
mise de cellule mere en cellule fille et de generation en generation. 
Des donnees experimentales de plus en plus solides s’accumulent en 
faveur de l’existence d’un code particulier a cette heredite. II reposerait 
sur des modifications covalentes de l’ADN et sur un infini repertoire 
d’ interactions etablies entre la double helice, les histones de la chroma- 
tine et de tres nombreuses proteines regulatrices (Fig. 5.11). 

Modifications biochimiques des histones et de I'ADN : 
I'epigenomique 

Les deux principaux composants biochimiques du code epigenetique 
hereditaire sont les mecanismes de methylation-demethylation de 
I’ADN au niveau notamment des dots CpG et les modifications des 
queues d’histones par des mecanismes d’acetylation-desacetylation et 
de methylation-demethylation. Une nouvelle discipline, I’epigenomique 
se propose d’etudier ces phenomenes epigenetiques a l’echelle des 
genomes entiers. Elle recherche notamment a identifier les sequences 
de I’ADN qui dirigent les modifications epigenetiques et celles qui en 
sont la cible. Une attention speciale est portee dans ces approches au 
role joue par les sequences repetees de type LINE (Long Interspersed 
Nucleic Element) et SINE (Short Intersperded Nucleic Element). Ces 
elements sont largement represents dans les genomes de vertebres, 
notamment de mammiferes, transmis fidelement de generation en 
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Figure 5.11 Les deux principaux composants du code epigenetique de la 
chromatine. 

Les groupes methyl (points roses) portes par certaines bases de I'ADN (cytosine princi- 
palement) contribue par leur presence a la repression des genes. Des combinaisons de 
diverses proteines regulatrices peuvent se fixer aux queues protuberantes des histones 
et alterer I'expression de I'ADN proximal. 

generation, et sont souvent mobiles dans les genomes sans que l’on 
ait encore bien compris qu’elles etaient reellement leurs fonctions 
genetiques. 

Genetique et epigenetique 
des jumeaux monozygotiques 

En raison de leur identite genetique parfaite - comme un clone compose 
de deux individus - les jumeaux monozygotiques sont depuis long- 
temps des modeles d’etude particulierement apprecies pour tenter de 
distinguer le role respectif des genes et de l’environnement dans la 
formation des phenotypes. Une etude recente portant sur les deux 
principales modifications epigenetiques (methylation de I’ADN et 
acetylation des histones) accumulees au cours du temps par 40 paires 
de jumeaux monozygotiques, places pour certains dans des environ- 
nements distincts, montre que 65 % des couples presentent des profils 
epigenomiques presque identiques, mais que 35 % manifestent des 
differences significatives. Une etonnante relation a ete etablie entre 
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I 'age des jumeaux et l’etendue des differences epigenetiques. Celles-ci 
sont egalement correlees avec le temps de separation qu’ont connu 
certains couples et leurs problemes de sante. Afin d’etablir la signifi- 
cation biologique de ces analyses, les empreintes methylees de certaines 
sequences ont ete soigneusement analysees. 52 % des sequences 
correspondent a des regions repetees et le reste a des genes connus ou 
suspectes. Sont egalement impliques des ilots CpG localises dans des 
regions promotrices differemment methylees, ce qui suggere qu'un 
effet sur l’expression des genes s’est manifesto. Des analyses utilisant 
des microreseaux d’ADN confirment ces donnees. Les profils d’expres- 
sion des jumeaux ages de 3 ans sont quasiment identiques alors que 
ceux des jumeaux ages de 50 ans different fortement. 11 est connu que 
les modifications dans l’expression des genes, dues a des marques 
epigenetiques accumulees au cours du temps, exercent une influence 
significative sur de nombreux types de maladies. II reste a savoir si les 
differences de profils epigenetiques observees chez les jumeaux mono- 
zygotiques sont le resultat d’une accumulation de mutations touchant 
le maintien ou la transmission des marques epigenetiques ou si les 
facteurs environnementaux comme 1’ alimentation ou la pollution ont 
joue un role. 

Modifications post-transcriptionnelies des transcrits 
par « editing » 

II s’agit d’un mecanisme qui, a l’instar de l’epissage, modifie la 
sequence d’un ARN apres sa transcription. La proteine qui en resulte 
est differente de celle qui est predite par la sequence du gene. 

Deux principales modalites sont connues : d’une part, la desamination 
d’une cytosine en uracile ou d’une adenine en inosine (Fig. 5.12) et 
d’autre part l’insertion ou la deletion d’uridine a l’aide d’un ARN guide. 
L’ adenosine desaminase reductase (ADAR) transforme directement sur 
l’ARN, l’adenine en inosine. Au moment de la traduction, l’inosine 
sera reconnue comme une guanine et la sequence de la proteine en sera 
modifiee ainsi que sa fonction. 

Empreintes parentales 

Chez les organismes diploides, les cellules somatiques possedent deux 
copies de genome et chaque gene autosomal est done represente par 
deux copies (deux alleles), chacune heritee de l’un des deux parents 
au moment de la fecondation. Pour la plupart des genes autosomaux, 
les deux alleles generalement s’expriment. Cependant, certains genes 
(< 1 %) sont porteurs d’une empreinte parentale qui determine lequel 
des deux alleles pourra s’exprimer (Fig. 5.13). Par exemple le gene 
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Figure 5.12 Mecanisme de l'« editing » de I'adenine en inosine (A — >1) au niveau 
du pre-ARNm.Trois stades de Taction de I'ADAR (Adenosine deaminase reductase) 
sur le transcrit de I'ARN polymerase sont presentes. 

(a) Le debut du transcrit contient une adenosine modifiable au sein du codon CAG 
correspondant a la glutamine. La poursuite de la transcription devoile une sequence 
intronique complementaire contenant un site d'editing. Un appariement de bases 
s'etablit et forme une helice avec la region codante contenant le codon CAG. L'enzyme 
ADAR se fixe au duplex et desamine A en I ce qui a pour consequence de donner un 
codon CIG (equivalent traductionnel de CGG). La glutamine sera remplacee par une 
arginine. Le duplex est ensuite dissocie par une helicase et i'intron elimine par le 
mecanisme habituel. 

(b) Les differentes positions au long d'une molecule d'ARN ou les adenosines peuvent 
subir un « editing ». Ces positions ne se rencontrent pas seulement dans les regions 
codantes des transcrits (2, 7) mais aussi dans les regions 3' et 5' UTR (1,8), dans les sites 
d'epissage en bordures d'introns et d'exons (3, 5) et au site de branchement (4, 6). Un 
« editing » peut egalement modifier un codon stop (7). 
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codant IGF2 (Insulin-like growth factor) s’ exprime uniquement via 
1’ allele paternel. L’ addition d’une empreinte est un processus dyna- 
mique qui varie a chaque generation. L’ empreinte peut s’effacer et se 
restaurer ce qui est en accord avec l’origine epigenetique (methyla- 
tion de I’ADN et modifications des histones) du processus. 


Allele 1 

CpG I ADN 




Methylation de 
I’ADN au niveau 
des Tlots CpG 



Figure 5.1 3 Caracteristiques des genes porteurs d'empreintes. 

La figure presente schematiquement une paire d'alleles porteurs d'empreintes au 
niveau des ilots CpG et de sequences repetees (fleches). Les agrandissements souli- 
gnent les changements observes selon les alleles : condensation des nudeosomes 
consecutive a des desacetylations d'histones et des methylations de I'ADN (allele 1); 
ouverture de la chromatine suite a une acetylation des histones et une demethylation 
de I'ADN (allele 2). L'aptitude a la transcription de I'allele 2 est indiquee par la fixation 
et faction d'un complexe de transcription. 
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Dans la lignee germinale, l’empreinte est effacee puis elle est retablie 
suivant le sexe de l’individu. Au cours de la formation des spermato- 
zoides, une empreinte paternelle s’etablit, alors que dans l’ovule une 
autre empreinte maternelle s’installe. Le processus d’effacement puis 
de reprogrammation s’avere indispensable afin que l’empreinte soit 
conforme au sexe de l’individu. Les genes porteurs d’empreintes sont 
generalement regroupes en clusters et partagent des elements regu- 
lateurs communs, comme des ARN non codants et des regions diffe- 
rentiellement methylees. Ces dernieres sont generalement riches en 
G + C, la cytosine etant souvent methylee sur l’une des copies mais 
pas sur l’autre. 

Les processus de mise en place des empreintes sont specifiques aux 
mammiferes placentaires et ils jouent un role dans le developpement 
et la croissance embryonaires. Certains genes de ce type participent 
au developpement postnatal (allaitement et metabolisme). Plusieurs 
phenotypes majeurs dependent des modalites de transmission ou de 
maintien d’empreintes parentales. Ainsi, a titre d’exemple, plusieurs 
maladies genetiques humaines sont associees a des empreintes anor- 
males du locus 15ql 1 (la bande chromosomique 1 1 est situee sur le bras 
long du chromosome 15). Cette region porte une empreinte epigene- 
tique differente sur les chromosomes paternel et maternel, les deux 
empreintes etant cependant indispensables pour le developpement 
normal de l’individu. Si l’une des empreintes n’est pas correctement 
transmise, en raison d’une deletion de la region touchant l'un des 
chromosomes ou si les deux chromosomes proviennent d’un seul des 
deux parents (disomie uniparentale), diverses maladies genetiques 
graves peuvent survenir. Ainsi, l’absence d'une empreinte paternelle 
se manifeste par le syndrome de Prader-Willi, caracterise par une 
hypotonie, une obesite et un hypogonadisme ; l’absence de l’empreinte 
maternelle se manifeste par le syndrome d’Angelman caracterise par 
une epilepsie, des tremblements et une expression faciale figee dans un 
sourire. 

5.5 LES RESEAUX DE REGULATION DE L'EXPRESSION DES GENES 

Analyse de I'expression a I'echelle des genomes : 
les outils de la genomique 

La genomique etudie la totalite du genome d’un organisme a la diffe- 
rence de la genetique moleculaire qui s’ attache plus specialement a 
1’ etude de genes particuliers en accordant une attention a leurs divers 
roles et fonctions. L’une de ses demarches principales consiste a etablir 
la sequence complete des genomes etudies (genomique structurale) et 
a proceder a l’analyse de i’expression dans sa globalite (genomique 
fonctionnelle) en fonction notamment les conditions environnementales. 
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Les outils privileges dans ces demarches reposent sur les analyses a 
haut debit, autorisees par les microreseaux d’ADN (puces a ADN) et 
la bioinformique. Des approches similaires sont pratiquees egalement 
avec l’ensemble des transcrits (transcriptome) d’une cellule ou d’un 
organisme, c’est la transcriptomique, ou avec les proteines (proteome), 
c’est la proteomique. 

Au debut de l’annee 2005, plus de 1000 genomes viraux etaient 
sequences, 250 genomes bacteriens et pres d’une trentaine de genomes 
eucaryotes. Beaucoup de ces genomes sont des organismes modeles 
(levure, drosophile, nematode, poisson zebre, arabette, souris, rat, 
chimpanze, homme) dont l’interet est grand a la fois sur les plans 
fondamental et applique. 

Une branche tres active de la genomique s’interesse tout particulie- 
rement a la comparaison des genomes et a leur evolution. Les donnees 
qui en resultent renouvellent et confirment a la fois les idees evolution- 
nistes proposees initialement par Darwin. Les relations genomiques 
entre des organismes vivants peuvent se resumer par une expression 
devenue celebre : « tous parents et tous differents » qui integre l’idee 
d’une commune origine (tous parents) et celle que mutation et selection 
ont cree au fil du temps beaucoup de differences (tous differents). De 
nombreuses sequences genomiques sont conservees entre les especes 
temoignant sans doute a la fois de l’avantage selectif qu’elles repre- 
sentent et de leur importance pour le fonctionnement du vivant. Mais 
toutes sont loin de coder des proteines, beaucoup sont transcrites en 
ARN non codants, ce qui a pour signification que le fonctionnement 
des organismes vivants semble etrangement dependre dans une mesure 
aux limites encore inconnues de nombreux ARN dotes de fonctions 
regulatrices. 

Les donnees fournies par les etudes de I’expression des genomes a 
grande echelle repose sur des approches utilisant les puces a ADN 
(Fig. 5.14 et Fig. 5.15). L’une des plus courantes aujourd'hui consiste 
a analyser de facon differentielle I’expression des genes entre deux 
etats physiologiques fonctionnels et a identifier ainsi ceux qui sont 
associes a la formation d’un phenotype particulier, qu’il soit biochi- 
mique ou morphologique (Fig. 5.14). On notera que ce type d’ analyse 
ne peut prendre en compte que les genes dont les transcrits (ARNm 
polyadenyles) sont traduits en proteines et exclut les ARN non codants. 

Un autre type d’analyse proche du premier consiste a identifier les 
sequences genomiques qui sont des sites de liaison pour les proteines 
exercant une fonction regulatrice. Bien que la probabilite est faible 
que ces sequences soient situees a l’interieur de genes, la demarche 
est construite de telle maniere qu’aucune eventualite ne soit exclue 
(Fig. 5.15). 


148 


Chapitre 5 • Expression des genes etdes genomes 


A A 

Culture de levures Culture de levures 

Echantillon a tester Echantillon de reference 



Extraction 
et purification 
des ARNm 


I 



AAAAA 

AAAAA 

AAAAA 

AAAAA 

AAAAA 



AAAAA 

AAAAA 

AAAAA 

AAAAA 

AAAAA 


- ARNm 


Transcription 

+ Cy5 I reverse en util isant I +Cy3 

une amorce 



- ADNc 


Hybridation sur un 
reseau d'ADN (puce) 
representatifs des 
genes 


oooooo 

oooooo 

oooooo 

oooooo 

oooooo 

oooooo 


O Echantillon de reference 
O Superposition du signal 
O Echantillon a tester 


Figure 5.14 Representation schematique de la demarche experimentale condui- 
sant a I'identification, a I'echelle du genome de la levure, des genes dont I'expression 
est associee a un etat physiologique (a un phenotype) particulier. 

Les ARNm polyA, extraits des levures placees dans des conditions differentes de culture 
ou soumises a un stress biochimique ou physique, sont retrotranscrits en ADN et marques 
par des fluorochromes differents (cyanines 3 et 5). Ils sont ensuite hybrides sur un 
microreseau de cibles ADN representatives des 6 200 genes de la levure. L'analyse des 
fluorescences de chaque spot et le traitement informatique des donnees identifient 
les genes dont I'expression varie en relation avec les conditions imposees initialement 
aux levures. En rouge, dans I'echantillon teste ; en noir dans I'echantillon de reference ; 
en rose, expression identique dans les deux echantillons. 


Figure 5.1 5 Representation schematique de la demarche experimentale condui- 
sant a I'identification, a I'echelle du genome de la levure, des sequences ADN liant 
des proteines regulatrices de genes dont I'expression est associee a un etat 
physiologique (a un phenotype) particulier. >- 
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Les sequences ADN sont obtenues par une technique d'immunoprecipitation de I'ADN 
chromatinien apres que la fixation des proteines de liaison a I'ADN ait ete rendue 
irreversible par « crosslinking » a la formaldehyde. Apres addition d'adaptateurs et 
marquage fluorescent, les sequences d'interet et les sequences temoins sont hybridees 
et analysees grace a un microreseau d'ADN representatif des regions intergeniques 
(regulatrices) du genome de levure. La fleche rouge signale un « spot » identifiant une 
sequence ADN ayant liee une proteine regulatrice (inhibitrice ou stimulatrice de 
I'expression de genes). Cette proteine est presente dans I'echantillon enrichi par 
immunoprecipitation (IP). 
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Les notions de hierarchie et de reseaux de genes 

Ces notions peuvent etre apprehendees experimentalement par la mesure 
des interactions proteiques alliee aux donnees fournies par des « puces 
ADN » analysant le niveau des transcrits (Fig. 5.16). Cette demarche 
suppose que l’on dispose de donnees controlees et fiables. A partir du 
reseau maitre qui donne l’ensemble des interactions etablies entre les 
proteines A a F (en haut a gauche) certaines proteines peuvent etre 
exclues selon les conditions cellulaires ou environnementales retenues 
(1 a 3) si l’on considere la perte d’expression de leurs genes corres- 
pondants, constatee a l’aide d’une puce ADN (en haut a droite). On peut 
ainsi etablir des sous-reseaux d’ interactions proteiques specifiques 
selon les conditions particulieres retenues par l’experimentateur. 
Ainsi, par une serie d’experiences utilisant des puces a ADN, faciles 
d’acces aujourd’hui, on peut done selon le type cellulaire ou les stades 
de developpement consideres, etablir une succession de reseaux 
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Figure 5.16 Differents sous-reseaux d'interactions proteiques specifiques de divers 
stades du developpement d'un organisme ou d'une cellule peuvent se deduire 
d'un reseau proteique maitre et de donnees acquises a I'aide de puces a ADN. 
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proteiques et geniques qui mettront en evidence les evolutions et les 
transitions adoptees par les reseaux de genes qui controlent les processus 
developpementaux. 

De 1’ ensemble de ces demarches se degage le concept considerant que 
les organismes fonctionnent des la premiere cellule-oeuf et les premiers 
stades de developpement, sur la base de reseaux de genes qui assureraient 
egalement leur adaptation permanente aux conditions environnemen- 
tales. Differentes approches statistiques sont necessaires pour degager les 
relations regulatrices specifiques (inhibitrices ou stimulatrices) existant 
entre les composants du reseau (Fig. 5.17). De telles approches ont 
abouti a l’idee qu’a 1’ inverse d’une organisation de type hierarchique 
avec des genes « architectes » et des genes « constructeurs » ou « reali- 
sateurs » qui, a titre d’exemple, s’etait degage des etudes genetiques sur 
la formation de l’oeil, le fonctionnement du genome des organismes 
vivants s’apparente a un fonctionnement en reseaux de reseaux, dont 
la complexite est encore tres loin d’etre apprehendee. 
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Figure 5.1 7 Schema tres simplifie d'un modele de reseau regulateur de I'expression 
de genes. 

Les cercles colores representent des activateurs transcriptionnels. Les ovales rectangles 
represented les genes qui au sein du genome sont les cibles de ces activateurs. La 
couleur du rectangle indique quels sont les activateurs qui regulent I'expression du 
gene en reponse a un stimulus environnemental. Les fleches etablissent la relation 
entre chaque activateur transcriptionnel et son gene cible. Un tel modele peut etre 
con^u comme un reseau individuel d'interactions geniques ou mieux encore comme 
une collection de reseaux regulateurs disposes eux-memes en reseaux, comme le 
suggere la fleche situee la plus a droite du schema. 
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Figure 5.18 Schema recapitulate specifiant les flux d'information allant du genome 
au phenotype et indiquant les types de donnees utilisees pour decrire les processus 
biologiques integres. 

De haut en has, on trouve successivement, I'ADN (genomique) transcrit d'abord en 
ARN (transcriptomique) et traduit ensuite en proteines (proteomique) qui elles-memes 
peuvent catalyser des reactions qui agissent ou donnent naissance a des metabolites 
(metabolomique) parmi lesquels on trouve des glycoproteines et des oligosaccharides 
(glycomique) et differents lipides (lipidomique). Beaucoup de ces composants peuvent 
etre marques et localises au sein de la cellule ou de I'organisme (localisomique). Les 
processus responsables de la formation et de la modification des composants sont 
bases habituellement sur des interactions moleculaires (interactions entre proteines 
et ADN par exemple pour la transcription, ou entre proteines dans la traduction et les 
reactions enzymatiques). Finalement, les voies metaboliques comportent des reseaux 
integres, des cartes de flux (fluoxomique) qui dictent le phenotype cellulaire ou de 
I'organisme (phenomique). 
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Autres « omiques » 

Les termes en « ome » (genome, transcrip tome, proteome, metabo- 
lome, lipidome, glycome, etc.) et « omiques » derivent du suffixe « - 
ome » dont 1' utilisation a ete generalisee pour designer des champs 
nouveaux de la connaissance et de la recherche en biologie. Pour 
certains (genome et genomique par exemple) ces termes sont reelle- 
ment fondes, ils sont plutot speculates pour d’autres. Le terme en 
« ome » designe une collection d’objets (les genes par exemple) dont 
il s’agit d’etudier la nature, l’origine, la fonction, etc., alors que le 
terme en « omique », qui possede a l’origine le statut d’un adjectif, 
designe maintenant les sciences correspondant a ces objets avec leurs 
concepts, hypotheses et speculations. Compte tenu qu’il s’agit dans 
tous les cas d’acquerir et de manipuler de grands ensembles de 
donnees parfois complexes, l’intervention de l’informatique est une 
constante de ces champs nouveaux de la biologie. 

Les sciences « omiques » se proposent de foumir des descriptions 
detaillees de tous les composants et interactions qui prennent place dans 
une cellule ou un organisme vivant. Ces donnees peuvent etre classifies 
en trois categories : les composants, les interactions, et les donnees rela- 
tives aux etats fonctionnels (Fig. 5.18). Les donnees relatives aux compo- 
sants detaillent le contenu moleculaire de la cellule ou du systeme etudie ; 
les donnees relatives aux interactions specifient les hens existant entre les 
composants moleculaires et les donnees relatives aux etats fonctionnels 
foumissent une lecture integree de tous les types de donnees « omiques » 
en revelant un phenotype global de la cellule ou du systeme. 

5.6 LA GENOMIQUE EN SANTE HUMAINE 
ET POUR LA SELECTION ANIMALE 

La genomique en sante humaine 

Decouvrir les variations genetiques hereditaires qui sont a Lorigine 
des pathologies humaines, constitue aujourd'hui l'un des delis scien- 
tifiques majeurs de la biologie et de la genetique. Le sequengage 
complet en 2001 du genome humain a represente, a cet egard, un 
progres considerable, mais l’exploit doit etre attenue par le fait qu’il 
s’agissait alors de la seule sequence genomique haploide. Aucune 
indication ne mettait en evidence la presence des variations de 
sequence qui sont, chez les humains comme chez tous les autres etres 
vivants, a l’origine pour l’essentiel des nombreuses differences 
phenotypiques. Depuis lors, de plus en plus d’etudes ont ete conduites 
pour decouvrir les hens de causalite existant entre les variations de la 
sequence genomique et la susceptibilite des humains vis-a-vis des 
maladies qui les affectent. 
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Les variations structurelles du genome humain 

Ces etudes conduisent a distinguer parmi les polymorphismes geneti- 
ques humains identifies, ceux dits « communs » presentant une 
frequence allelique d’au moins 1 % au sein de la population et ceux 
dits « rares » dont la frequence allelique est inferieure a 1 %. D’un 
point de vue structural, on peut distinguer deux types de variations 
genetiques : les SNP (pour Single Nucleotide Polymorphism ) et les 
polymorphismes dits structuraux (Tableau 5.1). 

Tableau 5.1 Les differentes classes de polymorphismes genetiques humains. 


Type 

de variation 

Exemple 

SNP (polymor- 
phisme d'un 
seul nucleotide) 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTTACTCCGACGATCAGGAT 

Indel (inser- 
tion/deletion) 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTTACCCC GATCAGGAT 

Substitutions 
de blocs 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTTAGAGTGACGATCAGGAT 

Inversion 

ATGGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTCGTCGGGGTAATCAGGAT 

Variation 
du nombre 
de copies 

ATGGCCTTTAGCCTTTACCCCGACGATCAGGAT 

ATGGCCTTTA CC C C GAC GAT C AGG AT 


Les SNP sont des variations de sequences ADN ou un simple nucleotide (A,T, G ou C) est 
modifie. Les autres variations dites structurelles comprennent : les « Indel » (pour insertion- 
deletion) qui se rencontrent lorsque une ou quelques bases sont presentes dans un 
genome et absentes dans les autres. Composees generalement de quelques bases elles 
peuvent parfois aller jusqu'a 80 kb. Les substitutions de blocs designent des sequences de 
nucleotides adjacents qui varient entre deux genomes. Les inversions sont observees lors- 
que I'ordre des paires de bases s'inverse dans une section definie d'un chromosome (on 
connait une inversion d'une longueur de 900 kb dans le chromosome 17 humain, chez 
20 % des individus ayant un ancetre nord europeen). Les variations du nombre de copies 
(ou CNV pour Copy Number Variation ) designent des sequences identiques ou presque qui 
sont repetees chez certains individus mais pas chez d'autres. Le nombre de repetitions 
varie et ces dernieres peuvent atteindre parfois une taille elevee de I'ordre de 2 Mb. 


L’origine des polymorphismes genetiques doit etre recherchee dans 
les evenements aleatoires non corriges survenant lors de la duplica- 
tion de l’ADN et de la recombinaison chromosomique concomitante 
de la mitose et de la meiose (voir chapitre 2). La plupart des variations 
genetiques, au sein de la population humaine sont ainsi dues au hasard 
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de la reproduction et ne contribuent probablement pas a la diversite 
phenotypique. On dit qu’elles sont neutres. Cependant pour une mino- 
rite d’entre elles, ces variations peuvent etre a I'origine d’une modifi- 
cation de phenotype. C’est notamment le cas lorsqu'im SNP se situe 
dans une sequence codante ou a proximite d’un element regulateur. 
Ainsi, lorsqif u n polymorphisme modifie un gene, ou une structure 
genetique, implique dans une pathologie, celui-ci peut participer a la 
susceptibilite ou a la resistance d’un individu a cette pathologie. 

Les SNP 

11s sont les plus frequents et l’on estime a pres de 11 millions le 
nombre de SNP total au sein du genome humain (7 millions ayant une 
frequence superieure a 5 %, le reste une frequence comprise entre 1 et 
5 %). L’ analyse de ces SNP au sein des premiers genomes individuels 
entierement sequences montre que la plupart d’entre eux sont reperto- 
ries dans la base de donnees generale des SNP ( Tableau 5.2). II a ete 
montre que les alleles des SNP presents dans une meme region geno- 
mique sont souvent correles les uns aux autres. Cette correlation, 
designee par le terme de « desequilibre de liaison », varie a la fois de 
fagon complexe et imprevisible, au sein des genomes et entre les 
differentes populations. 

Tableau 5.2 Polymorphismes de type SNP identifies dans quatre genomes remarquables. 


Genome 

NbdeSNP 

% de presence dans la 
base generale des SNP 

J. Craig Venter 

3213401 

91,0% 

James D. Watson 

3 322 093 

81,7% 

Chinois ethnie Han 

3 074 097 

86,4% 

Africain ethnie Yoruban 

4139196 

73,6% 


C. Venter et J. Watson sont deux celebres scientifiques parmi les premiers humains dont 
le genome a ete entierement sequence. Ms sont de type caucasien. Les deux autres indi- 
vidus sont des anonymes de types asiatique et africain. Les trois premiers genomes pos- 
sedent un nombre similaire de SNP bien represents dans la base actuelle de donnees 
des SNP humains. Au total 5, 2 millions de SNP differents sont identifies entre les trois 
genomes. Lorsqu'un plus grand nombre de genomes individuels sera sequence, 
1 1 millions de SNP devraient etre identifies. Le genome africain possede un plus grand 
nombre de SNP, plutot nouveaux vis-a-vis de la base de donnees. Cependant dans 
I'ensemble, il apparait que lorsque deux genomes humains sont compares, la majorite 
des bases qui different appartient a la categorie des variations communes. La base de 
donnee generale (dbSNP) est accessible librement a I'adresse suivante: http:// 
www.ncbi.nlm.nih.gov/projects/SNP/ 
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Les polymorphismes structuraux 

Pris dans leur ensemble, les polymorphismes structuraux represented 
entre 9 et 25 Mb (soit jusqu’a pres de 1 % du genome) ce qui suggere 
un role tres significatif de ces variations genetiques en matiere 
d’ evolution du genome. ( Tableau 5.3). 

Tableau 5.3 Polymorphismes structuraux identifies dans le genome de Craig Venter. 


Polymorphismes structuraux 

Nombre 

Longueur (en pb) 

Substitution de bloc 

55 823 

2-206 

Indels (heterozygotes) 

851 575 

1 -82711 

Inversions 

90 

7 - 670 345 

Nombre de copies 

62 

8 855 - 1 925 949 


Le genome d'un individu caucasien (C. Venter) contient au total environ 4,1 millions de 
variations genetiques dont 22 % sont des polymorphismes structuraux representant 
74 % de toutes les bases variantes. Cependant, de nombreux polymorphismes structu- 
raux restent vraisemblablement a decouvrir avec I'augmentation du nombre de geno- 
mes individuels sequences. Comme pour les SNP, on s'attend a ce que la majorite de 
ces variations soit commune a beaucoup d'humains. 


Contribution des divers polymorphismes genetiques 
aux phenotypes chez I'homme 

Chez les humains des centaines de phenotypes complexes determi- 
nent V allure exterieure, le comportement, mais aussi la propension a 
developper certaines maladies. On designe sous le terme de « trait 
complexe » le phenotype qui, selon les individus examines, presente 
divers degres de variation anatomique, physiologique ou biochimique 
formant ainsi une sorte d’echelle de distribution continue. On consi- 
dere que de tels phenotypes sont les produits de 1’ action independante 
de nombreux genes (ou mieux de leurs alleles), mais aussi de facteurs 
environnementaux ainsi que de subtiles interactions entre genes 
(alleles) et facteurs de l’environnement. Pres de 4 millions de poly- 
morphismes genetiques sont presents en moyenne simultanement 
chez un individu ( Tableaux 5.2 et 5.3). La difficulty consiste a etablir 
lesquels parmi ces polymorphismes, s’averent responsables de la 
transmission hereditaire des phenotypes, notamment ceux qui predis- 
posent a developper une pathologie (cancers, maladies cardio-vascu- 
laires, maladies neurodegeneratives, etc.). Deux theories opposees 
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(theories 1 et 2, voir l’exemple ci-dessous) sont altemativement 
proposees a ce sujet. La premiere affirme que les traits complexes 
sont principalement dus a un grand nombre de polymorphismes 
communs, chacun d’entre eux etant porteur d’un effet modeste. A 
l’oppose, la seconde propose que les traits complexes resultent d’une 
somme d’effets majeurs portes par un petit nombre de polymor- 
phismes rares. 


Les etudes d'associations entre phenotypes et genotypes. 

Avec la disponibilite du sequengage complet du genome humain et la 
decouverte de millions de SNP au sein des genomes, de nouveaux 
outils de genotypage ont ete rapidement developpes. Ces outils a haut- 
debit, appelees « puces ADN », permettent de genotyper simultane- 
ment plusieurs centaines de milliers, voire plusieurs millions de SNP 
repartis sur l’ensemble du genome. La disponibilite de ces nouvelles 
ressources a rendu possible la recherche, a 1’ echelle du genome 
dans son ensemble, d’une association statistique entre un phenotype 
(par exemple une pathologie) et certains polymorphismes genetiques 
communs ; cette approche est appelee etude dissociation a grande 
echelle. 

D’une maniere generale, ces etudes dissociation a grande echelle 
exploitent les differences de polymorphismes genetiques qui sont 
presents chez un grand nombre d’individus, souvent plusieurs milliers, 
atteints par une pathologie (les cas) comparativement a ceux presents 
dans un nombre similaire de patients sains (les controles). On parle 
d’etudes dissociation « cas-controles » ou « cas-temoins ». L’objectif 
ici est de rechercher s’il existe certains polymorphismes pouvant etre 
statistiquement associes a la maladie etudiee, et influencer la suscep- 
tibility ou la resistance d’un individu au developpement de cette 
pathologie. La majorite des polymorphismes mis en evidence par ces 
etudes dissociations a grande echelle ne se sont pas reveles etre des 
mutations « causales » de la maladie, et n’expliquent generalement 
qu’une petite partie de la maladie etudiee (voir exemple ci-dessous). 
Ce type d’etude reste cependant tres utile car elle permet de cibler 
des regions du genome associees a une pathologie et permet de 
restreindre ainsi les regions a explorer a la recherche de genes candi- 
dats et de mutations causales. Les SNP identifies jouent alors un role 
de marqueurs moleculaires. 

Ainsi, si plusieurs SNP participant a une meme voie de signalisa- 
tion sont identifies, il est vraisemblable que cette voie de signalisation 
participe au developpement de la maladie. De meme si plusieurs 
pathologies sont statistiquement associees a un locus particulier, cela 
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suggere une base genetique commune a ces maladies. Plusieurs SNP 
d’un locus du chromosome 8 ont ete associes au cancer de la prostate, 
du colon et du sein, suggerant que ce locus est implique dans le 
processus de carcinogenese. Des etudes supplementaires ont permis 
de confirmer ces resultats et d’identifier la mutation causale, situee 
dans un stimulateur de la transcription. 

Outre une meilleure comprehension des bases moleculaires et des 
genes impliques dans la resistance ou la susceptibilite a certaines 
maladies, les resultats de ces etudes rendent possible le testage 
genetique. Ainsi il devient possible pour un patient de connaitre le 
risque (relatif) qu’il presente vis-a-vis d’une pathologie ou encore 
de pouvoir recevoir une information personnalisee sur la reponse de 
son organisme a un compose pharmaceutique. Cette derniere appli- 
cation, appelee pharmacogenomique, est un enjeu important en 
terme de sante humaine. A titre d’exemple, des etudes dissocia- 
tions ont permis de montrer que des polymorphismes du gene 
CYP2C9 sont associes au metabolisme de la warfarine, un anticoa- 
gulant utilise pour prevenir la formation de caillots dans les vais- 
seaux sanguins. En fonction de la forme allelique qu’ils portent, 
certains patients vont assimiler plus ou moins rapidement ce 
compose, ce qui risque d’engendrer une hemorragie ; la connais- 
sance de leurs variations genetiques permettra done de personnaliser 
la dose de warfarine a donner dans les traitements afin d’eviter ces 
effets secondaires. 

Comme le montre la figure 5.19, ce type d’approche a litterale- 
ment explose au cours des dernieres annees (Fig. 5.19a). En 2009, 
pres de 250 etudes dissociation a grande echelle ont ete realisees 
chez 1’ho mm e. Mi-2010, 599 etudes de ce type ont ete publiees et 
ont permis d’identifier 2 905 SNP associes a pres de 150 patholo- 
gies humaines ! Par ailleurs, la reduction du cout de ces etudes, liees 
a des outils de plus en plus performants permet d’analyser des 
cohortes de patients de plus en plus importantes et d’ organiser 
notamment des phases de validations independantes, indispensables 
pour valider les associations observees au cours d’une seule etude 
(Fig. 5.19b). 
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Figure 5.19 Repartition des etudes dissociation en fonction du temps. 

a. Les premieres etudes dissociations a grande echelle datent de 2005 ; depuis leur 
nombre ne cesse d'augmenter d'annee en annee, notamment en raison d'outils de 
genotypage de plus en plus performants et de moins en moins couteux. Les appro- 
ches statistiques mises en place pour determiner les associations sont egalement de 
plus en plus performantes. 

b. li est important de noter que ces etudes necessitent des cohortes de grande tailie 
pour etre efficace. Une des limites principales de ces approches reste le trap faible 
nombre de patients participant a ces etudes. Malgre tout, la tailie des cohortes utili- 
ses dans les etudes dissociation est de plus en plus importante, ce qui augmente 
beaucoup la puissance de ce type d'etude. L'ensemble des etudes dissociations reali- 
sees chez I'homme est centralisee et accessible librement a I'adresse suivante : http:// 
www.genome.gov/gwastudies/ 
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Polymorphismes genetiques du diabete de type 2 : un exemple 
illustrant les deux theories a propos des traits complexes 

Au total, dix-huit polymorphismes genetiques augmentant le risque 
de developper un diabete de type 2 chez des individus caucasiens ont 
ete mis en evidence au cours d’etudes dissociation a grande echelle. 
Si quatre d’entre eux avaient deja ete suspectes au cours d’etudes 
ciblant des genes candidats, les quatorze autres SNP n’ avaient jamais 
ete identities dans la susceptibilite genetique a cette pathologie, ce qui 
a permis de cibler de nouveaux genes, et de nouvelles voies de signa- 
lisation jusqu’alors ignorees. A titre d’exemple, 1’ identification d’un 
polymorphisme a l’interieur d’un recepteur a la melatonine 
(. MTNR1B ) a permis de montrer que la voie de signalisation contro- 
lant le cycle circadien joue aussi un role dans le diabete de type 2. 

Classiquement, la force de l’association calculee lors d’etudes de 
type « cas-temoins » est mesuree par les odds ratios ; cette notion se 
definit par le rapport des probabilites qu’un polymorphisme genetique 
existant dans la population de patients atteints soit egalement present 
dans la population controle. Si V odds ratio est significativement supe- 
rieur a un, alors le polymorphisme est associe a la maladie. Dans le 
cas du diabete de type 2, les frequences alleliques nrinoritaires (MAF) 
et les odds ratios c alcules pour les 18 SNP intervenant dans 
1’ augmentation du risque, sont similaires aux valeurs obtenues lors 
d’etudes dissociations conduites sur d’autres maladies. Les MAF 
s’echelonnent de 0,073 a 0,50 et les odds ratios vont de 1,05 a 1,15 
sauf pour le gene TCF7L2 qui possede un odds ratio de 1,37. 

Au total, ces 1 8 polymorphismes expliquent moins de 4 % de la 
part totale du phenotype, et une faible fraction de son heritabilite. 
Ceci a pour consequence qu’il reste pour cette pathologie de 
nombreux genes a decouvrir. Si l’on suppose que les polymorphismes 
genetiques encore inconnus presented des MAF et des odds ratios 
similaires a ceux deja identifies et une heritabilite de 40 %, il resterait 
plus de 800 polymorphismes genetiques a decouvrir (theorie 1) ! Si, 
au contraire, on considere qu'il s’agit de mutations rares, avec des 
MAF 10 fois plus petites que celles deja identifies (done s’echelon- 
nant de 0, 0073 a 0,05) et des odds ratios 10 fois plus grands (de 1,63 
a 4,05) alors environ 85 nouveaux polymorphismes devraient etre 
inrpliques dans le diabete de type 2 (theorie 2). 

Polymorphismes genetiques de type SNP et longevite humaine 

Dans les pays industrialises, une personne sur 6 000 est centenaire, et 
ceux que l’on appelle les supercentenaires - ayant plus de 110 ans - 
represented un individu sur 7 millions. II faut noter que 90 % des 
centenaires n’ont pas de handicap sur le plan de la sante avant l’age de 
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93 ans. Dans une etude portant sur I' analyse complete du genome de 
1 055 centenaires comparativement a 1 267 sujets controles, des cher- 
cheurs ont bati un modele predictif prenant en compte 150 SNP. 11 en 
ressort que lorsque l’on soumet les informations genetiques (c’est-a- 
dire les genotypes des 150 SNP) d’un individu a ce modele mathema- 
tique, il est possible de determiner correctement dans 77 % des cas sa 
predisposition a devenir centenaire, ce qui atteste fortement du carac- 
tere hereditaire de la longevite. Cependant la presence de certains 
facteurs de risque (cancer, maladies cardio-vasculaires, etc....) amene 
a moduler selon des groupes de risques les voies permettant 
d’atteindre cette extreme longevite. La surprise vient du fait que la 
presence de polymorphismes genetiques associes a des maladies ne 
met pas en evidence de difference marquee entre les centenaires et les 
sujets controles. Cela signifie que ce n’est pas l’absence de predispo- 
sition pour des maladies qui fait vivre longtemps mais bien le fait 
d’etre porteurs de mutations favorisant la longevite. Cela implique 
aussi que si l’on veut calculer le risque de developper une maladie, il 
ne faut pas seulement s’appuyer sur la presence de polymorphismes 
genetiques qui lui sont associes mais tenir compte du patrimoine 
genetique global. 

La genomique pour la selection animale 

Contrairement a ce que l’on observe en matiere de sante humaine ou 
les informations tirees de la connaissance du genome humain sont, 
malgre de solides espoirs, encore peu exploitees, il est vraisemblable 
que la genomique animale va modifier rapidement et fortement les 
pratiques de l’elevage. 

L’ utilisation de la genomique, pour les animaux de ferme, n’appa- 
rait pas pourtant a priori tres differente de celle qui est envisagee en 
matiere de sante humaine. Pour tous les cheptels, l’information geno- 
mique doit en effet conduire, sous peine d’inefficacite, a l’ameliora- 
tion de leur etat general et de leur productivite. Dans son principe il 
s’agira, tout d’abord d’identifier le ou les genes d’interet, puis de 
selectionner preferentiellement les alleles favorables au detriment des 
alleles defavorables. Pour cela il n’est pas reellement necessaire 
d’identifier les genes ou les mecanismes moleculaires sous-jacents, 
par exemple du rendement laitier, de la qualite de la viande ou de la 
fertilite. 11 suffit de correler quantitativement l’amelioration du trait 
avec certains polymorphismes genetiques puis d’etablir ensuite, un 
programme de selection qui accroitra la representation de ces mutations 
au sein de la population constituant le cheptel. 

Ainsi a partir d’une premiere ebauche d’ assemblage de la sequence 
du genome bovin, les chercheurs et les industriels ont cree une « puce 
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ADN » permettant de genotyper plus de 50 000 SNPs. Disponible 
depuis janvier 2008, cet outil a permis des le mois de juillet suivant a 
Tindustrie laitiere d’ameliorer ses programmes de selection. La 
disponibilite croissante de banques d’ADN, tres representatives des 
populations bovines etudiees, ainsi que les nouvelles methodes de 
sequenqage a haut debit ont permis d’ identifier rapidement un grand 
nombre de SNP exploitables pour creer ce type d’outils. Des outils 
similaires sont disponibles pour d’autres especes animales telles que 
le chien, le cheval, le mouton, le pore ou encore le poulet. 

Une autre difference capitale qui distingue les applications de la 
genomique chez 1'homme et V animal, reside dans le fait que l’infor- 
mation moleculaire peut s’appuyer, chez les principales especes 
d’animaux de ferme, sur de grandes bases de donnees phenotypiques 
et genealogiques deja en place au moment ou les sequences genomi- 
ques deviennent disponibles. 11 devient alors possible de rechercher 
des marqueurs genetiques associes aux phenotypes d’interet pour 
organiser une selection basee sur cette information genomique. 

11 n’en demeure pas moins que le grand interet de la selection geno- 
mique reside dans le fait qu’elle est moins traumatisante, a la fois 
pour le public et pour les autorites de controle, que ne le sont l’obten- 
tion d’animaux transgeniques ou d’animaux clones, tout en permet- 
tant d’accelerer le progres genetique. Si la selection genomique tient 
ses premieres promesses, la sante animale, le bien-etre animal et la 
productivity de l’elevage s’en trouveront profondement changes. 



POINTS CLEFS 


>- Les mecanismes de la transcription reposent sur I'activite d'une famille 
d'enzymes, les ARN polymerases, qui realisent le meme type de reaction 
(une synthese d'ARN a partir d'une matrice d'ADN) quelle que soit la cellule 
procaryote ou eucaryote consideree. Les ARN polymerases se fixent a des 
regions de I'ADN designees sous le terme de promoteurs, souvent avec 
I'aide de proteines additionnelles. Les ARN polymerases adoptent une struc- 
ture tridimentionnelle en forme de pince ce qui leur permet d'enserrer le 
brin d'ADN (oriente dans le sens 3'-> 5') et en coulissant de le transcrire en 
un ARN oriente dans le sens 5'-> 3'. 

>- Au cours de la transcription et avant meme que I'ARN ne soit exporte hors 
du noyau pour etre ensuite traduit (s'il s'agit d'un ARNm), il subit une serie 
de modifications qui concourent a la production a partir du transcrit primaire 
d'un ARN dit mature, apte a assurer les fonctions auxquelles il est destine. 
Dans I'ordre ou elles interviennent on distingue pour les ARNm : I'addition 
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d'une coiffe a I'extremite 5', I'epissage des introns et I'addition d'une 
queue de polyadenylation a I'extremite 3'. 

>- La decouverte de la regulation des genes de I'operon lactose a mis en 
evidence pour la premiere fois, I'existence de sequences ADN regulatrices 
distinctes des sequences codantes. 

>- Les sequences ADN regulatrices sont reconnues par des proteines specifiques 
activatrices ou repressives. Une meme proteine regulatrice peut etre a la 
fois repressive et activatrice selon les circonstances. 

>- Contrairement aux genes bacteriens dont les sequences sont continues, 
la plupart des genes eucaryotes ont une sequence organisee en regions 
codantes (les exons) interrompues par des regions non codantes (les introns). 
Ils sont transcrits en une copie ARN continue, le transcrit primaire (appele 
aussi pre-ARNm, s'il s'agit du precurseur de I'ARNm). Le pre-ARN est converti 
en ARN mature grace a une machine moleculaire, le spliceosome. 

>- La regulation de I'epissage alternatif des ARN messagers a pour consequence 
principale d'accroitre la diversite des proteines cellulaires et d'aboutir a la 
synthese de proteines differentes selon les types cellulaires considers. 

>- L'heredite epigenetique repose sur la transmission d'une information qui 
n'est pas codee dans la sequence de I'ADN bien qu'elle soit transmise de 
cellule-mere en cellule-fille et de generation en generation. 

>- Les deux principaux composants biochimiques du code epigenetique here- 
ditaire sont les mecanismes de methylation-demethylation de I'ADN au 
niveau notamment des Hots CpG et les modifications des queues d'histones 
par des mecanismes d'acetylation-desacetylation et de methylation- 
demethylation. 

>- Chez les organismes diploides, les cellules somatiques possedent deux 
copies de genome et chaque gene autosomal est done represente par 
deux copies (deux alleles), chacune heritee de I'un des deux parents au 
moment de la fecondation. Pour la plupart des genes autosomaux, les 
deux alleles generalement s'expriment. Cependant, certains genes (< 1 %) 
sont porteurs d'une empreinte parentale qui determine lequel des deux 
alleles pourra s'exprimer. 

>- La genomique etudie la totalite du genome d'un organisme a la difference 
de la genetique moleculaire qui s'attache plus specialement a I'etude de 
genes particuliers en accordant une attention a leurs divers roles et fonctions. 
L'une de ses demarches principales consiste a etablir la sequence complete 
des genomes etudies (genomique structurale) et a proceder a I'analyse de 
I'expression dans sa globalite (genomique fonctionnelle) en fonction notam- 
ment les conditions environnementales. Des approches similaires sont 
pratiquees egalement avec I'ensemble des transcrits (transcriptome) d'une 
cellule ou d'un organisme, e'est la transcriptomique, ou avec les proteines 
(proteome),c'est la proteomique. 
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> De nombreuses sequences genomiques sont conservees entre les especes 
temoignant sans doute a la fois de I'avantage selectif qu'elles representent 
et de leur importance pour le fonctionnement du vivant. Mais toutes sont 
loin de coder des proteines, beaucoup sont transcrites en ARN non codants, 
ce qui a pour signification que le fonctionnement des organismes vivants 
semble etrangement dependre dans une mesure aux limites encore 
inconnues de nombreux ARN dotes de fonctions regulatrices. 

>- Les organismes multicellulaires fonctionnent des la premiere cellule-oeuf 
et les premiers stades de developpement, sur la base de reseaux de genes 
qui assurent leur adaptation permanente aux conditions environnementales. 


QCM - QROC 

5.1 La sequence ci-dessous appartient a un segment d’ADN en cours 
de transcription. La fleche indique le sens de transcription de ce 
segment. 

Brin A : 

5 ' -CTAGTAAGGAGGTGCGAATGCTATGAAAGCAACTAAACTAGTACTTGGGGCGGTGAT-3 ' 

s>- 

Brin B : 

3 ' -GATCATTCCTCCACGCTTACGATACTTTCGTTGATTTGATCATGAACCCCGCCACTA-5 ' 

Quel est le brin matrice ? 

Quel est le brin codant ? 

Donner la sequence du transcrit. 

5.2 L’ADN d’un gene morcele est hybride avec l’ARNm mature 
correspondant. 11 se forme alors une structure avec des regions comple- 
mentaires (ARN-ADN) separees par des boucles d’acide nucleique 
monocatenaire. Parmi les propositions suivantes, lesquelles sont bonnes ? 

a) Les boucles sont faites d’ADN. 

b) Les boucles correspondent aux exons du gene. 

c) Quand ils sont hybrides, l’ADN et l’ARN sont antiparalleles. 

d) Le brin d’ADN qui s’ hybride a l’ARNm est le brin codant. 

5.3 Considerons un gene eucaryote de 1 500 pb qui code pour une 
proteine de 300 amino-acides. Peut-on predire les tailles respectives du 
transcrit primaire, des eventuels introns, de l’ARNm et des regions 3’ 
et 5’ non codantes ? 

5.4 Une cellule est exposee a des agents mutagenes. Une proteine 
produite par cette cellule est examinee avant et apres le traitement. 
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II s’avere que dans la cellule traitee, la proteine contient un trypto- 
phane (Tip) a la place d’une arginine (Arg). 

En supposant que cette substitution soit due a une mutation ponctuelle, 
quelle est cette mutation ? 

5.5 Completer toutes les cases du tableau 


ADN 

3' 

C 












5' 

5' 
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3' 

ARNm 

5' 
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3' 

Anticodon 
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3' 










G 

C 

A 

5' 

Acide amine 
incorpore 
dans la proteine 

nh 2 


Trp 



COOH 


5.6 Quand une mutation par insertion ou deletion d’un ou deux 
nucleotides se produit dans un intron d’un gene, est-ce que cela affecte la 
sequence du transcrit et de la proteine qui pourrait en resulter ? 

5.7 Valider les affirmations suivantes. 

a) Les regions codantes et non codantes d’un gene contiennent des 
signaux de regulation de la transcription 

b) Seules les regions codantes possedent des signaux de regulation de 
la transcription 

c) Seules les regions non codantes possedent des signaux de regulation 
de la transcription 

d) Les signaux de regulation peuvent se trouver hors des regions codantes 
et non codantes d’un gene 

5.8 Comment expliquer que l’environnement influe sur l’expression 
des genes ? 


REPONSES 


5.1 a) Brin B 

b) Brin A 

c) 

5 ' -CUAGUAAGGAGGUGCGAAUGCUAUGAAAGCAACUAAACUAGUACUUGGGGCGGUGAU-3 ' 

5.2 Les bonnes propositions sont : a et c. Les boucles correspondent aux 
introns et le brin d’ADN qui s’hybride a l’ARNm est le brin matrice. 
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5.3 La taille du transcrit primaire est de 1 500 nucleotides. On ignore 
la presence et done les tailles des introns. L’ ARN messager comporte, 
apres un eventuel epissage, 903 nucleotides (900 correspondent aux 
300 amino-acides et 3 au codon d’ arret). Les tailles des regions non 
codantes component au total 597 nucleotides,, introns eventuels 
compris. La taille des regions non codantes en 3’ et 5’ ne peuvent pas 
etre determinees sur la base des informations fournies. 

5.4 Arg a les codons suivants : CGU, CGC, CGA, CGG . AGA, AGG 
Tip a un seul codon, UGG . 

Aucun codon de Arg ne commence par U. La mutation doit par conse- 
quent concerner cette position du codon. Etant donnee que la mutation 
est ponctuelle, il ne peut done s’agir que du changement C^Uou 
A -» U. Au niveau de V ADN e’est done la paire C-G qui est mutee en 
paire T-A ou la paire A-T qui devient T-A. 


5.5 
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5.6 L’insertion ou deletion d’un ou deux nucleotides dans un intron 
d’un gene peut ne rien modifier dans les sequences de l’ARNm et de 
la proteine. Cependant si cette mutation modifie les sites donneurs 
et accepteurs d’epissage, ou le point de branchement d’un intron, 
T epissage en sera affecte et la sequence intronique pourra se retrouver 
dans l’ARNm. Dans ce cas, les sequences de l’ARNm et de la proteine 
qui en resulte seront modifiees. 

5.7 a) et d) 

5.8 En exenjant par divers mecanismes une modulation du niveau et/ 
ou de l’activite des proteines regulatrices (activateurs et represseurs) 
de la transcription. 


OBJECTIFS PLAN 


3 Transmission 

etheredite 


6.1 Les divisions cellulaires 

6.2 Liaison genetique et cartographie 

6.3 Cartographie des centromeres et analyse des tetrades lineaires 

6.4 Cytogenetique et assignation chromosomique 

6.5 Analyse de la liaison genetique et test du CHI-deux ou x 2 

6.6 Heredite liee au sexe 

6.7 Transmission de transgenes 

6.8 Derives aux lois de Mendel dans la transmission des caracteres 

> Connaitre les mecanismes de recombinaison genetique qui generent la 
diversite des gametes 

> Comprendre la liaison genetique et savoir cartographier des genes 

> Savoir identifier la transmission de caractere liee au chromosome sexuel 

> Comprendre en quoi les interactions genetiques modifient la transmission 
des caracteres 


6.1 LES DIVISIONS CELLULAIRES 

La mitose et la meiose constituent les deux modes de division chez les 
eucaryotes. 

La mitose 

La mitose concerne a la fois les cellules haploides et diploides. Elle 
aboutit a deux cellules Lilies genetiquement identiques a la cellule 
mere (Fig. 6.1), le nombre de chromosome par cellule demeurant 
constant. La mitose s’effectue apres la replication de l’ADN qui 
s’accomplit au cours de la phase S du cycle cellulaire (voir dans la meme 
collection, Biologie cellulaire). Elle se subdivise en quatre phases : 

> la prophase initie la mitose avec le debut de la condensation de la 
chromatine, et l’individualisation des chromosomes. A ce stade, les 
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deux chromatides soeurs sont accolees sur toute leur longueur, et plus 
particulierement au niveau du centromere, region d’hypercondensa- 
tion de la chromatine, auxquels viennent se fixer de part et d’autre des 
proteines formant des complexes proteiques, appeles kinetochores ; 
> la metaphase ou alignement des chromosomes est un point cle de 
la mitose. Tous les chromosomes ont leurs deux kinetochores lies 
aux microtubules, et s’alignent dans le plan equatorial de la cellule. 
L’equilibre etablit entre les deux chromatides d'u n meme chromo- 
some les maintient et les oriente vers les poles opposes de la cellule ; 



Figure 6.1 Representation schematique des differentes phases de la mitose. 
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>- 1' anaphase assez rapide ne dure que quelques minutes pendant 
lesquelles les chromatides, devenues maintenant des chromosomes, 
migrent vers les poles opposes de la cellule ; 

>- la telophase se caracterise par le regroupement des chromosomes 
fils aux poles de la cellule qui marque la fin de la mitose. Des 
enveloppes nucleates se reforment autour de chaque lot de chromo- 
somes fils qui commencent a se decondenser. 

Ainsi, les deux cellules filles heritent d’un nombre egal de chromo- 
somes (n pour les cellules haploides et 2 n pour les cellules diploides). 

La meiose 

La meiose ne peut exister que pour des cellules obligatoirement 
diploides et aboutit a partir d’une cellule mere diploide a quatre cellules 
haploides genetiquement differentes entre elles (Fig. 6.2). La reduction 
du contenu en chromosomes resulte de l’existence d’une seule repli- 
cation de l’ADN suivie par deux cycles de divisions meiotiques : 

>- la premiere division meiotique ou meiose I, au cours de laquelle les 
chromosomes dont les chromatides restent associees segregent a 
chacun des poles de la cellule lors de 1’ anaphase I. II y a reduction 
du nombre de chromosomes, leur nombre etant divise par 2, a la suite 
de cette premiere division. On parle alors de division reductionnelle ; 
>- la deuxieme division meiotique ou meiose II durant laquelle les 
chromatides soeurs se separent et migrent aux poles de la cellule selon 
un mode egal de repartition. On parle de division equationnelle. 

Lors de la premiere division meiotique les chromosomes homologues 
s’apparient formant des structures appelees bivalents. A ce stade les 
chromatides soeurs dupliquees restent etroitement associees, et s’appa- 
rient avec leurs homologues pour former des structures a 4 chromatides. 
L’appariement est un processus complexe qui permet a chaque cellule 
fille d'heriter d’un lot haploide de chromosomes comprenant un seul 
exemplaire de chaque paire d'homologues. 11 se deroule au cours de la 
prophase I, et comporte : 

> Le stade leptotene, marque par le debut de 1’ individualisation et 
de la condensation des chromosomes. Les chromatides soeurs sont 
associees entre elles par 1’ intermediate de proteines cohesives et 
formeront les structures axiales du complexe synaptonemal. Des 
appariements transitoires favorisent l’alignement des homologues 
entre eux. Les evenements de recombinaison homologue sont inities 
et se caracterisent par des cassures des brins de la molecule d’ ADN 
qui permettent des interactions entre les brins d’ADN appartenant a 
des chromatides homologues. En certains points de cassures se produi- 
sent des interactions conduisant aux crossing-over et constituent 


Meiose II Meiose I 
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Appariement des chromosomes 
homologues en prophase I 



Au moins 1 
crossing-over par 
paire homologue 




des centromeres 
I’anaphase II 


v 





Quatre gametes avec n chromosomes 
redistribues de maniere aleatoire 


Figure 6.2 Representation schematique de la meiose. 

Settles sont representees les division reductionnelles de la 1 re division meiotique et 
equationnelle de la 2 e division. Le graphique montre les variations du contenu en ADN et 
en chromosome au cours de la meiose. La cellule diploide contenant 2 n chromosomes 
donne quatre cellules haplo'ides a n chromosomes. Pour plus de clarte, seule la segre- 
gation d'un chromosome est montree ainsi que celle de ses chromatides lors de la 
2 e division. 
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des chiasmas. Le crossing-over necessite une cassure des doubles 
helices d’ADN maternelles et paternelles de chacune des deux 
chromatides impliquees et leur reunion. Ces premiers points d’ancrage 
servent ulterieurement pour la formation des elements centraux des 
complexes synaptonemaux constitues de proteines qui, sur toute la 
longueur du bivalent, maintiendront les homologues apparies. 

> Les stades zygotene puis pachytene correspondent respectivement 
a la propagation de l’element axial du complexe synaptonemal et 
l’appariement via T element central des chromosomes homologues 
sur toute leur longueur. 

> Le stade diplotene coincide avec la disparition du complexe synapto- 
nemal, et la perte de l’alignement etroit des chromosomes homologues 
qui restent connectes entre eux au niveau des chiasmas. 

La separation des homologues a l’anaphase I ne pourra s’effectuer 
qu’apres disparition des connexions assurees par les chiasmas, seule 
celle au niveau du centromere sera maintenue empechant la separation 
des chromatides d’un meme chromosome. Par la suite, la meiose 11 
s’effectuera apres une courte interphase sans aucune replication 
prealable de l’ADN. 

La recombinaison meiotique 

La recombinaison meiotique designe tout processus meiotique qui 
donne un produit haploide presentant une combinaison d’ alleles 
differente de celle portee par les genotypes haploides a l’origine du 
meiocyte, cellule dans laquelle s’effectue la meiose, cellules de la lignee 
germinale chez les mammiferes. Cette recombinaison est detectee en 
comparant les genotypes des descendants (genotype de « sortie ») par 
rapports a ceux des parents (genotypes d’« entree »). Ainsi, tout produit 
meiotique avec une nouvelle combinaison des alleles fournis par les 
deux genotypes parentaux est par definition un recombinant. 

11 s’avere facile de detecter les recombinants chez les organismes 
dont les cycles vitaux sont haploides comme la levure (voir Fig. 4.12, 
chapitre 4) car les genotypes peuvent etre deduits directement des 
phenotypes. En revanche, pour les organismes diploides, detecter les 
recombinants est beaucoup plus complique. On se doit de connaitre 
les genotypes des gametes de depart et des gametes resultants pour 
avoir acces aux recombinants. La demarche consiste a obtenir a partir 
de lignees pures (parents PI) pour les caracteres concernes une gene- 
ration FI heterozygote (par exemple de genotype AaBb), puis de 
croiser les individus FI avec un individu double recessif (de geno- 
type aabb) ayant une seule possibility de genotype pour ses gametes 
( ab ), ce parent est egalement appele testeur (Fig. 6.3). F’ analyse de la 
descendance a Tissue d’un tel croisement appele croisement test ou 
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« test-cross » permet d’identifier les recombinants dont les phenotypes 
different de ceux des parents PI. Les recombinants sont produits par 
deux processus distincts : 1’ assortment independant et les crossing-over. 
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Figure 6.3 Detection des recombinants d'une meiose diploide par un croisement 
test. 

Les individus de la FI ayant tous ie meme genotype, leur croisement avec un double 
recessif permet d'obtenir a la generation F2 des individus dont le genotype peut se 
deduire du phenotype et de les classer selon leur type parental ou recombinant. 

La recombinaison interchromosomique 

Le brassage interchromosomique correspond a une redistribution 
aleatoire des chromosomes parentaux lors de l’anaphase de la 
premiere division meiotique. Ainsi dans l’exemple represente dans la 
figure 6.4, on considere 2 paires de chromosomes homologues pour 
chaque parent. On constate pour certains gametes recombinants de la 
generation FI, un tel brassage interchromosomique. Ce processus 
engendre une grande diversite de gametes, car il existe 2" possibilites 
de repartition de chromosomes, soit chez l’homme 2 23 (8,4 x 10 6 ) 
gametes susceptibles d’etre genetiquement differents. 
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Figure 6.4 Recombinants issus de la recombinaison entre genes non lies a la 
suite d'un assortiment independant. 

Chaque paire d'homologue porte un des caracteres etudies. 


Lorsque les genes sont situes sur des chromosomes differents, les 
gametes sont issus d’un assortiment independant. Les genotypes 
« Aabb » et « aaBB » sont de type recombinant car ils different des 
genotypes parentaux de depart « AABB » et « aabb ». La frequence 
des recombinants a la suite d’un assortiment independant doit etre de 
50 %. Une telle valeur obtenue apres un croisement-test laisse supposer 
que l’assortiment des genes etudies est independant, c’est-a-dire que 
les genes sont portes par des paires de chromosomes distincts. 


La recombinaison intrachromosomique 

En second lieu, la diversite des gametes peut etre accrue en raison des 
enjambements chromosomiques ou « crossing-over » (Fig. 6.2 et 6.5). 
C’est la recombinaison intrachromosomique, elle accroit encore un 
peu plus la diversite genetique des populations ulterieures. 
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Parental 


Recombinant 


Recombinant a B Parental A B 

Figure 6.5 Crossing-over au cours de la meiose et production de gametes 
recombinants. 


Des le debut du xx e siecle, les travaux sur l’heredite menes par 
William Bateson, avec comme modele le pois de senteur, et ceux de 
Thomas Hunt Morgan, avec comme modele la drosophile, avaient 
montre que la segregation des caracteres n’obeissait pas toujours aux 
lois de Gregor Mendel. 

Prenons comme exemple un croisement-test ou les individus FI 
sont croises avec le parent double recessif, les resultats obtenus sont 
presentes dans le tableau 6.1. 
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Tableau 6.1 Exemple de l'effectif des descendants 
A l'issue d'un croisement-test pour deux genes lies. 


Combinaisons 
alleliques 
gametes possibles 

Caracteristiques des individus 
de la generation F2 

Nombre 

d'individus 

FI 

P2 

Phenotypiques 

Genotypiques 

Observes 

Attendus sur la 
base du rapport 
1:1:1 :1 

AB 

ab 

AB 

AaBb 

1 402 

750 

Ab 

ab 

Ab 

Aabb 

98 

750 

aB 

ab 

aB 

aaBb 

102 

750 

ab 

ab 

ab 

aabb 

1 398 

750 


Les differentes combinaisons alleliques des gametes de la FI sont 
les suivantes : AB, Ab, aB et ab. Par contre, le testeur ne transmet que 
les deux alleles recessifs, c’est-a-dire une seule combinaison allelique 
(ab). Aussi, les differents phenotypes de la generation F2, obtenus par le 
croisement FI x P2 (parent double homozygote recessif) dependront 
uniquement de la contribution gametique de FI. Les individus sont 
comptes et classes selon leur phenotype (ou genotype deduit). On peut 
remarquer que : 

> Les valeurs observees pour chaque classe phenotypique different 
largement du rapport mendelien 1:1: 1:1 attendu, si la segregation 
des caracteres avait ete independante. 

> Deux classes phenotypiques predominent, l’une correspond aux 
individus porteurs de la combinaison des deux caracteres dominants 
(A et B ) et 1’ autre a ceux possedant les caracteres recessifs (a et b). 
Le nombre d’individus de ces deux sous-populations represente 
93,4 % de la population totale, le rapport entre les deux sous- 
populations : individus de phenotype AB (1 402) et individus de 
phenotype ab (1 398) etant voisin de 1. II faut remarquer que ces 
phenotypes F2 correspondent aux deux combinaisons gametiques 
(AB et ab) provenant des parents et prealablement transmis a la 
generation FI. 

> Deux classes d’individus ayant les phenotypes respectifs Ab et aB 
sont minoritaires et ne represented que (98 + 102)/3 000 = 6,6 % 
de la population F2. La encore, on notera que le rapport entre les 
deux sous-populations (98/102) est voisin de 1. 
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Pour expliquer ces resultats, les geneticiens emploient l'expression 
« couplage physique » entre les alleles dominants (ici A et B) d’une 
part et les alleles recessifs (a et b) d’ autre part. Cette liaison physique 
empeche que leur segregation soit independante a 1’ exception d’une 
tres faible proportion. Thomas Morgan proposa que les genes etudies 
se localisent sur une paire de chromosomes homologues (Fig. 6.6). l’un 
portant une combinaison allelique, par exemple les alleles dominants 
A et B, et son homologue la combinaison allelique associant les deux 
alleles recessifs a et b. On parle pour qualifier cette situation de liaison 
genetique. Les evenements de recombinaison intrachromosomiques 
qui peuvent se produire entre la region portant les deux caracteres 
etudies etant a l’origine des quelques recombinants observes. 
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Figure 6.6 Recombinaison entre genes lies et frequence des gametes. Un seul 
chromosome porte les 2 caracteres etudies. 

La recombinaison intrachromosomique peut se produire entre 
n’importe lesquelles des deux chromatides non soeurs (Fig. 6.7). Cepen- 
dant le pourcentage de recombinants est toujours inferieur a 50 % en 
raison de leur rattachement au meme chromosome, ce qui empeche 
leur assortiment independant. On doit de plus noter que la valeur seuil 
de 50 % n’implique pas forcement Lassortiment independant des 
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caracteres. En effet, des genes lies mais tres distants sur un meme 
chromosome auront cependant une frequence maximale de recombi- 
naison de 50 %. Pour l’observateur tout se passe comme si des genes 
disposes ainsi etaient independants, c’est-a-dire sur deux chromosomes 
differents. C’est la forte probabilite qu’il y ait au moins un crossing- 
over dans le grand intervalle qui separe les deux genes qui favorise 
une transmission independante de ces genes, bien que physiquement 
ils soient sur le meme chromosome. 


Meiose Gametes produits 



A B 


Figure 6.7 Exemples de possibility de crossing-over. 

Les gametes produits sont tous de type parental en absence de crossing-over (a) ; de 
type parental et recombinant lors de crossing-over impliquant les chromatides 1 et 3 (b), 
ou 1 et 4, et 2 et 3 (c). Ce dernier exemple montre que lors de la meiose les crossing- 
over peuvent s'effectuer entre n'importe lesquelles des chromatides non soeurs et que 
plusieurs crossing-over peuvent s'effectuer pour un meme bivalent. 

6.2 LIAISON GENETIQUE ET CARTOGRAPHIE 

Chaque molecule d’ADN composant un chromosome, contient des 
sequences informatives ou genes disposes lineairement. Aussi, la 
cartographic d’un genome consiste a : 


178 


Chapitre 6 • Transmission etheredite 


> localiser ou assigner les genes sur les chromosomes et etablir les 
distances qui separent les genes, c’est la cartographie genetique : 

>• reconstituer le genome a l’echelle moleculaire en etablissant au final 
la totalite de la sequence, c’est la cartographie physique. 

Naturellement, les cartographies physique et genetique, tout comme 
le sequencage sont interdependants et leur association ont favorise 
l'avancee rapide de la connaissance des genomes complexes comme 
celui de l'liomme. 

Frequence de recombinaison intrachromosomique 
et distance genetique 

En augmentant le nombre de caracteres (ou genes) etudies, on constate 
que le pourcentage de recombinants parmi la descendance peut varier 
de 0 a 50 % selon la localisation du couple de caracteres observes. 
Comme la frequence de recombinaison entre deux loci reflete la 
distance genetique qui les separe, on peut evaluer ainsi les distances 
entre les genes qui determinent les caracteres : plus le nombre de 
recombinants est eleve, plus il y a en theorie de chance pour que les 
genes soient eloignes sur le meme chromosome. En resume, evaluer les 
distances entre les genes sur un meme chromosome revient a calculer 
le nombre de recombinants pour differents couples de caracteres dans 
la descendance. C’est pourquoi on utilise le pourcentage de recombi- 
nants comme une mesure de la distance lineaire separant deux genes. 
On peut ainsi etablir une carte genetique lineaire qui donne la position 
relative des differents loci ou genes les uns par rapport aux autres. Sur 
la carte, les distances sont mesurees en unite de carte genetique ou 
UG (Unite Genetique) : une UG etant la distance separant deux loci 
dont la frequence de recombinaison est de 1 % (c’est-a-dire 1 produit 
sur 100 de la meiose est un recombinant). L’unite la plus couramment 
employee est le Morgan (en l’honneur de Thomas Hunt Morgan). On 
parle en general de centimorgan (cM) ; 1 cM equivaut a une frequence 
de recombinaison de 1 %, soit 1 UG (chez 1'homme, on considere 
qu’une distance d’un cM equivaut en moyenne a une sequence d’ ADN 
de 10 6 pb). Chez le ver nematode, 1 cM equivaut a 7,5 x 10 5 pb. 

Comment cartographier plus de deux genes lies 

Quand on examine le nombre de recombinants pour differents couples 
de caracteres, on etablit des distances genetiques entre les loci compo- 
sant ces couples. Cependant, si un locus C est commun a deux couples 
(AC et BC ), comment etablir la cartographie de la region ABC ? En 
effet, si A et C sont distants de 7 cM, et B et C de 10 cM, plusieurs 
combinaisons s’averent possibles, comme presente dans la figure 6.8. 
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BA C 


-> 7cM * 

10 CM ► 

B C A 


« 10 CM ■* 7cM ► 

Figure 6.8 Position envisagee pour differents loci portes par un meme chromo- 
some. Les distances entre les caracteres sont donnees en centimorgans (cM). 

Dans le cas (1) on postulera une distance entre A et B de 10 - 7 = 3 cM, 
alors que dans le cas (2) A et B seront distants de 10 + 7 = 17 cM. 
Avec le gene B comme point de depart, deux cartes sont possibles 
respectivement BAC (1) ou BCA (2). Pour lever Fambigui'te, il s’avere 
necessaire d’analyser les couples deux a deux, soit dans notre exemple 
les couples de loci AB, BC, AC. Considerons que ABC sont des alleles 
dominants et abc des alleles recessifs. Les parents P, et P 2 donnant la 
FI (de genotype AaBbCc) peuvent posseder, parmi d’autres, les geno- 
types respectifs suivants : aaBBCC et AAbbcc, auxquels on se referera 
par la suite. 

Lors d’un croisement test de FI avec un triple recessif aabbcc, les huit 
types gametiques FI haploides possibles peuvent etre denombres grace 
aux phenotypes des individus diploides de la generation F2, puisque 
le testeur gametique n’apporte que le type gametique abc ( Tableau 6.2). 

Tableau 6.2 Classification et denombrement 

EN FONCTION DE LEURS PHENOTYPES D'lNDIVIDUS ISSUS D'UN CROISEMENT-TEST. 


( 1 ) 


( 2 ) 


Phenotypes 

Genotypes 

Nombred'individus 

aBC 

aaBbCc 

1 250 

Abc 

Aabbcc 

1 258 

abC 

aabbCc 

143 

ABc 

AaBbcc 

139 

ABC 

AaBbCc 

93 

ABC 

AABBCC 

99 

aBc 

aaBbcc 

8 

AbC 

AabbCc 

10 
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Les phenotypes aBC et Abe correspondent aux types parentaux de 
depart. Ils sont a la generation F2 les populations les plus representees 
(1 250 et 1 258 individus respectivement). Les autres populations ne 
comportent qu'un faible nombre d’individus qui resulte de recombi- 
naisons (brassages intrachromosomiques) lors de la meiose aboutissant 
a la formation des gametes de la generation FI. 

La comparaison entre types parentaux et types recombinants peimet 
d’identifier les evenements de recombinaison entre deux loci. Par 
exemple pour les loci A et B, les recombinants qui different des types 
parentaux aB et Ab sont dans l’ordre ab et AB ; leur representation 
dans les differentes populations recombinantes s’etablit a 143 + 139 + 
93 + 99 = 474 individus, soit une frequence de recombinaison de 
15,8 % (x 100). Pour les loci A et C, les recombinants sont ac et AC, 
avec au total 93 + 99 + 8+ 10 = 210 individus soit une frequence de 
7 %. Enfin pour B et C, les recombinants sont Be et bC, avec au total 
143 + 139 + 8 + 10 = 300 individus soit une frequence de 10 %. Dans 
les trois cas les frequences de recombinaison sont inferieures a 50 %, 
les trois genes sont lies et situes sur le meme chromosome, les deux 
genes les plus distants etant A et B avec 15,8 % de recombinaison soit 
15,8 cM. A ce stade, nous pouvons preciser la carte genetique pour 
ces trois genes. 

L’ordre des genes defini arbitrairement en (2) en placard A a droite 
de C, correspond a celui determine par V analyse des frequences de 
recombinaison. On doit remarquer que pour cet ordre la somme des 
distances entre AC et BC (7 + 10=17 cM) differe malgre tout de celle 
calculee a partir des recombinaisons entre les loci A et B (15,8 cM). 
Pour expliquer cette difference, il faut prendre en consideration les 
deux sous-populations les moins representees ayant les phenotypes : 
aBc et AbC. Pour les caracteres A et B, nous retrouvons les deux 
combinaisons parentales aB et Ab. Dans la figure 6. 9, on decrit la 
possibility que deux « crossing-over » se soient produits, l’un entre A 
et C, et F autre entre C et B conduisant a des doubles recombinants. 
Leurs phenotypes pour les caracteres A et B etant identiques a ceux 
observes chez les parents, nous avons exclu ces deux sous-populations 
rares du comptage des recombinants formes entre A et B. Puisqu’il 
s’agit de doubles recombinants, nous devons au contraire les compta- 
biliser deux fois. Ainsi la frequence de recombinaison (FR) entre les 
caracteres A et B devient : 

FR = [143 + 139 + 93 + 99 + 2 (8 + 10)] x 100 = 17 % 

La distance separant A et B s’eleve maintenant a 17 cM, ce qui 
correspond bien a la somme des deux plus petites distances calculees 
ci-dessus. 
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I O ■ (1) 

a c b 

i q i i i (2) 

a C b 

i m i i ■ (3) 

c 

i O 1 (4) 

AC B 

Figure 6.9 Exemple de double « crossing-over ». 

Dans F exemple choisi ici, nous avons pu mettre en evidence des 
doubles recombinants, car chaque « crossing-over » est entoure par une 
paire de genes possedant deux alleles distincts pour chaque caractere. 
Si le caractere C avait ete homozygote (alleles C), les doubles recom- 
binants auraient eu comme phenotypes aBC et AbC, c’est-a-dire 
identiques pour les trois caracteres aux types gametiques parentaux de 
depart : ( ciaBBCC et AAbbCC). Ils auraient alors ete classes par erreur 
dans les types parentaux lors de F identification et du comptage des 
individus F2. 

Remarque : lorsque la distance entre deux loci est relativement 
grande, l’existence de deux crossing-over, voire plus, peut entrainer 
une sous-estimation de la distance reelle les separant. II s’avere done 
necessaire d’ avoir de nombreux caracteres (marqueurs) repartis a 
des intervalles reguliers sur le chromosome, afin d’obtenir une carte 
genetique la plus proche possible de la realite. 

Les sous-populations de doubles recombinants ont des effectifs tres 
faibles compares aux autres populations. C’est pourquoi un seul arran- 
gement des genes sur le chromosome, parmi les differents possibles, 
peut donner ces sous-populations rares lors de double crossing-over. 
Ce qui permet, en examinant la composition de la descendance, d’en 
deduire directement l’ordre des trois genes en confrontant les differentes 
combinaisons theoriques possibles (Fig. 6.10). On voit que, parmi les 
trois arrangements theoriques, seul l’ordre (3) donne des doubles 
recombinants compatibles avec les plus faibles effectifs observes dans 
les sous-populations de la descendance soit acB (8 individus) et ACb 
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(10 individus). Ce resultat est en accord avec le denombrement des 
differentes sous -populations et avec l'hypothese (2) de depart. 


Agencement parentaux 
theoriques 

a B C 

Double recombinants 
correspondants 

a b C 

X 


"X 


— 




A 

b 


c 

A 

B 

c 

B 

a 


C 

B 

A 

C 

X 


X 


— 



b 

A 


c 

b 

a 

c 

a 

C 


B 

a 

c 

B 

X 


X 


— 




A 

c 


b 

A 

C 

b 


Figure 6.10 Differentes combinaison de doubles recombinants. 

Pour retrouver les genotypes parentaux ( aB ou Ab), seule la combinaison 3 permet de 
I'obtenir avec deux crossing-over, chacun d'eux s'effectuant entre des couples de 
caracteres differents. 


La notion d'interference entre crossing-over 

A partir des frequences de recombinaisons etablies entre les differentes 
paires de genes, il devient possible d’estimer, de maniere theorique, 
pour la region concernee, le pourcentage de doubles recombinants. Si 
la frequence de recombinaison entre A et B est de 7 % et celle entre A 
et C de 10 %, la frequence d’ apparition des doubles recombinants 
devrait etre egale a 0,07 x 0,10 = 0,007 = 0,7 %. Ce qui correspond a 
un nombre theorique d’individus de (0,7 x 3 000)/100 = 21 individus 
doubles recombinants. Or dans notre exemple, sur les 3 000 individus 
composant la generation F2, on en denombre 18. La difference suggere 
que, dans les regions proches, il n’y a pas d’independance dans la 
realisation du crossing-over. Il existe une interference (I) qui s’explique 
par le fait que l’existence d’un crossing-over diminue la probability 
qu’un deuxieme crossing-over se produise dans une region tres proche. 
I peut s’exprimer ainsi : 

i _ | nombre de doubles recombinants observes 
nombre de doubles recombinants attendus 

Le rapport entre les nombre de recombinants observes et attendus 
est appele coefficient de coincidence (cdc), done 1=1- cdc. 


6.3 • Cartographie des centromeres et analyse des tetrodes lineaires 


183 


Quand 1 = 1, l’interference est maximale, il n’y a pas de doubles 
recombinants observes dans la region concernee. En revanche si 1 = 0, 
le nombre attendu est identique au nombre theorique, done le rapport 
ou coefficient de coincidence est egal a 1. En general, la valeur de 1 
se situe entre 0 et 1, dans notre exemple 1 = 1- 18/21, 1 = 1- 0,85 
d’ou 1 =0,15. Cette valeur de l'interference reflete recart entre le 
nombre d’individus observes et le nombre d’individus attendus. 
L’ existence d’ interferences designe une plus grande frequence des 
simples crossing-over dans une region chromosomique. 

6.3 CARTOGRAPHIE DES CENTROMERES 
ET ANALYSE DES TETRADES LINEAIRES 

Les centromeres, regions des chromosomes qui ne presentent pas 
d’heterozygotie, sont difficiles a cartographier. Cependant, chez des 
champignons comme Neurospora crassa dont les produits de la meiose 
sont ordonnes dans l’asque, les centromeres peuvent etre cartographies. 
En effet, le meiocyte produit une tetrade lineaire, puis chaque spore 
subit une mitose postmeiotique (Fig. 6.11). Les huit ascospores, consti- 
tuent une octade, et sont reparties dans l’asque en fonction du profil 
de segregation resultant des deux divisions meiotiques. Ainsi, on peut 
utiliser la cartographie du centromere pour estimer la distance qui 
separe un locus du centromere d’un chromosome. Cette technique est 
basee sur le fait qu’a la suite d’un crossing-over lors d’une meiose 




Divisions Probabilites 

meiotiques equivalentes 


Figure 6.1 1 Les quatre differents profil de segregation de seconde division. 

A la suite d'un crossing-over impliquant deux chromatides non soeurs, les differentes 
combinaisons sont indiquees par les fleches,Z\ et a segreguent dans les noyaux distincts 
lors de la seconde division meiotique. La repartition des ascospores dans I'asque 
lineaire depend des chromatides impliquees dans le crossing-over. 
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Tordonnancement impose aux ascospores sera modifie. Par exemple, 
en croisant deux individus ayant chacun un allele different (a ou A) a 
un locus et en absence de crossing-over dans la region comprise entre 
le locus et le centromere, on observera une octade comportant deux 
blocs adjacents de quatre ascospores (l’un de genotype a et l’autre de 
genotype A). En revanche, si un crossing-over s’effectue dans cette 
region, les ascospores seront reparties par bloc de deux en fonction 
des chromatides impliquees dans la recombinaison. On obtient ainsi 
quatre differents profils de repartition (Fig. 6.11). On les appelle 
profils de segregation de seconde division (M n ) car les alleles a et A, 
du fait du crossing-over, se retrouvent dans les noyaux a la fin de la 
premiere division. Sans crossing-over, les noyaux a Tissue de la premiere 
division porteront les memes alleles (aa ou AA), on parle alors de 
profils de segregation de premiere division (Mj). 

La frequence des octades ayant un profil M n doit etre proportionnelle 
a la distance qui separe le locus du centromere, elle peut done servir 
pour estimer la taille de la region. Apres un croisement entre individus 
A et a, on denombre les octades de profil M , et celles de profil M n . II 
en resulte que le pourcentage de recombinants est egal a : 

Nombre de MII/N ombre total d’ ascospores (M, + M n ) 

En realite, la valeur trouvee represente un nombre de meiose et non 
le nombre de chromatides recombinantes. Comme dans les meioses, 
seulement 50 % des chromatides sont recombinantes, on doit diviser 
la frequence des M n par 2 pour la convertir en unites genetiques. 

Inversion chromosomique et cartographie 

Chez la drosophile la cytogenetique permet de reperer les inversions 
chromosomiques. En effet, dans les glandes salivaires de ces insectes, 
on trouve des chromosomes polytenes, chromosomes geants a la suite 
de multiples duplications de leurs chromatides qui restent soudees 
donnant un profil de bandes caracteristiques de chaque chromosome. 
Les mutations responsables de rearrangements chromosomiques comme 
des inversions peuvent alors etre facilement raises en evidence sur un 
tel chromosome polytene grace a une modification de l’agencement 
des bandes (Fig. 6.12). Si a cette mutation est associe un nouveau 
phenotype, le geneticien peut determiner la position approximative de 
T allele mute responsable de ce nouveau phenotype. 

Grace aux chromosomes polytenes, il a ete possible de caracteriser 
un gene homeotique, le gene bithorax ( BX-C ) par une marche sur le 
chromosome. Les auteurs avaient remarque que des inversions dans la 
region 89E du chromosome 3 affectaient profondement l’embryon de 
drosophile. Cette region devait correspondre a un gene majeur du 
developpement. Cependant, ils ne disposaient pas de sonde pour 
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Hybridation d'une sonde rosy 
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chromosome normal 
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BX-C 




Fragment portant 
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utilise comme sonde 


Marche sur le chromosome vers BX-C 


Figure 6.12 Exemple d'utilisation d'une inversion chromosomique identifiee sur 
un chromosome polytene pour la localisation d'un gene. 

Dans I'exemple montre I'inversion d'une partie des regions a permis de rapprocher une 
region connue portant le gene rosy de la region dans laquelle on suspecte la presence 
d'un gene implique dans le developpement BX-C, mais encore non identifie. 


commencer la marche dans cette region. En revanche, ils connais- 
saient dans la region 87E, la presence du gene rosy (implique dans la 
couleur de l’oeil) pour lequel ils disposaient d’une sonde specifique. 
Des chromosomes issus de mutants presentant une inversion entre les 
regions 87E et 89E ont ete hybrides avec des sondes specihques du 
gene rosy. Ainsi, une sonde s’hybrida au niveau du point de cassure. 
Une banque realisee a partir de l’ADN presentant I’inversion a ete 
criblee avec la sonde du point de cassure afin d’isoler le fragment 
situe au point d’inversion qui doit contenir a la fois les sequences 87E 
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et 89E. Apres hybridation sur un chromosome normal, ce fragment 
revele bien les deux regions 87E et 89E. Avec la partie du fragment 87E/ 
89E reconnaissant 89E, la marche vers le gene BX-C peut commences 


6.4 CYTOGENETIQUE ET ASSIGNATION CHROMOSOMIQUE 

Cette approche du genome eucaryote s’emploie pour une localisation 
des genes et des sequences anonymes sur les chromosomes. En general, 
ce sont des sequences deja connues qui, par diverses methodologies, 
sont assignees sur un chromosome. 

La technique d’hybridation de cellules somatiques est utilisee pour 
la cartographic du genome de nombreuses especes. Elle consiste comme 
le montre la figure 6.13 a fusionner des cellules d’especes differentes. 
La fusion cellulaire (fibroblastes humains/cellules tumorales de souris 
par exemple) est suivie par une fusion des noyaux, et les cellules 
hybrides uninuclees contiennent en melange des chromosomes humains 
et des chromosomes murins. Comme les chromosomes humains different 
des chromosomes murins par leur nombre et leur taille, ils peuvent 
etre distingues au sein d’une cellule hybride. Cependant au cours des 
divisions cellulaires, les cellules hotes de souris, immortelles car 
tumorales, perdent de faqon aleatoire une partie des chromosomes 
humains. Cette elimination peut etre suivie en microscopie grace aux 
techniques de cytogenetique, technique qui repose sur la coloration 
des chromosomes. Les cellules hybrides sont cultivees sous forme de 
lignees separees, chacune d’elle ayant un contenu distinct mais bien 
identifie en chromosomes humains. 

Avec une banque chromosomique complete, c’est-a-dire dont 
l’ensemble des lignees contient tous les chromosomes d’une espece, 
ici l'homme, il s’avere possible de rechercher la presence d’un gene 
ou d’un marqueur de type mini ou microsatellite. Comme la sequence 
est connue, la recherche s’effectue le plus souvent par PCR avec comme 
matrice l’ADN extrait des differentes lignees. La combinaison des 
resultats obtenus permet d’assigner celle-ci a un chromosome, comme 
le montre la comparaison des lignees hybrides presentee dans le 
tableau 6.3. 

En comparant les resultats, on observe que : 

> la sequence A se trouve dans deux lignees 1 et 3, qui ont en 
commun le chromosome 21 ; 

> la sequence B est presente dans les lignees 3, 4 et 5, qui toutes 
possedent le chromosome 10 ; 

> la sequence C est mise en evidence dans les lignees 1 et 3, qui ont 
en commun le chromosome 21 ; 
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Fibrobaste 

humain 
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Formation 

d’hybrides 
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Colonie 

d’hybrides 

Figure 6.1 3 Techniques d'obtention d'hybrides somatiques. 

Les hybrides (homme/souris) sont produits par fusion ceilulaire grace au virus de Sendai 
qui est utilise comme agent de fusion. Dans les heterocaryons, les deux noyaux vont 
fusionner, et la cellule hybride contiendra dans son noyau le genome murin et le 
genome humain. Tres rapidement, une partie des chromosomes humains disparaitront 
alors que la cellule tumorale conservera la totalite du genome murin. Par analyse cyto- 
genetique, on caracterise chaque colonie hybride par son contenu en chromosomes 
humains encore presents dans les cellules tumorales. L'identification par cytogenetique 
a permis d'isoler des colonies hybrides qui different par leur contenu en chromosomes 
humains. 
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Tableau 6.3 Sequences humaines presentes dans les lignees hybrides 

ET CHROMOSOMES HUMAINS CONTENUS DANS CHACUNE D'ELLES. 



Lignees cellulaires hybrides 

1 

2 

3 

4 

5 

Sequences humaines 
recherchees 

A 

+ 

- 

+ 

- 

- 

B 

- 

- 

+ 

+ 

+ 

C 

+ 

- 

+ 

- 

- 

D 

+ 

+ 

- 

+ 

- 

Chromosomes humains 
presents dans la lignee 

1 

- 

+ 

- 

- 

- 

10 

- 

- 

+ 

+ 

+ 

21 

+ 

- 

+ 

- 

- 


> la sequence D est observee dans les lignees 1, 2 et 4, qui en 
revanche ne possedent pas le meme assortiment chromosomique ; 
le resultat dans ce cas s’avere inexploi table. 

On peut done assigner au chromosome 10 la sequence B et au 
chromosome 21 les sequences A et C. De tels resultats amenent a une 
localisation « grossiere » d’une sequence. On determine le chromo- 
some porteur de la sequence, sans toutefois en preciser la region (bras 
court, bras long par exemple). 

6.5 ANALYSE DE LA LIAISON GENETIQUE 
ET TEST DU CHI-DEUX OU % 2 

En genetique, les resultats experimentaux sont souvent proches des 
resultats attendus, mais cependant legerement differents. Un test statis- 
tique s’avere necessaire pour confronter ces resultats entre eux et 
valider l’hypothese de depart. Le test du % 2 permet ce controle. 11 
constitue un moyen de quantifier les differents ecarts attendus, lies au 
seul fait du hasard, entre une valeur predite et celle obtenue experimen- 
talement, si l’hypothese est vraie. Cependant, a toute valeur prise par 
un ecart correspond une probabilite, il s’avere done necessaire de 
definir une valeur seuil au-dela de laquelle 1’hypothese est rejetee. Par 
convention, une probabilite inferieure ou egale a 5 % est consideree 
comme un critere de rejet de l’hypothese. Que signifie cette valeur de 
probabilite ? 

> Si l’hypothese est correcte et du simple fait du hasard, e’est la 
probabilite d’ avoir un ecart au moins aussi grand par rapport aux 
resultats prevus. 
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>- Si la probability est superieure a 5 %, cela signifie que les resultats 
sont compatibles avec l’hypothese de depart. 

> Le resultat du test du % 2 depend forcement du nombre d’individus 
analyses. Plus il est important, plus le test est liable. 

Le x 2 est calcule a partir de la formule suivante : 

X 2 = X(0 - E) 2 /E pour toutes les classes analysees 

ou : O est egale au nombre observe dans une classe et E (du terme 
anglais « espected ») celui attendu. 

En analyse de liaison genetique, a partir de quel ecart a 50 % peut 
on considerer que deux genes sont lies ? Le seul critere qui puisse etre 
pris en compte c’est l’absence ou la presence d’un assortiment inde- 
pendant. Pour cela, il faut tester l'hypothese de l’absence de liaison 
(hypothese nulle). Si elle est rejetee par un test de % 2 , l’existence 
d’une liaison genetique sera retenue. 

En prenant l’exemple d’une population d’individus obtenus 
apres un croisement-test, on denombre 600 descendants repartis 
comme suit : 

> 170 de phenotype AB (parental) ; 

> 136 de phenotype Ab (recombinant) ; 

> 134 de phenotype aB (recombinant) ; 

> 160 de phenotype ab (parental). 

La frequence de recombinaison est de 45 %. Ceci pourrait etre un 
cas de liaison genetique car la valeur est inferieure a 50 %. Un test de 
% 2 est done necessaire pour calculer la probability que le resultat 
obtenu est bien du au hasard. Pour chaque allele, les proportions sont 
de : 

Segregation de A et a 

A a Total 

Segregation B 170 134 304 

de B et b b 136 160 296 

Total 306 294 600 

Les proportions alleliques sont de 306/600 pour A, 294/600 pour a, 
304/600 pour B et 296/600 pour b. A partir de ces proportions, les 
valeurs attendues (E) pour les individus AB sont de : (306/600 x 304/ 
600) x 600= 155,04. 
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Le tableau des valeurs attendues est : 

Segregation de A et a 

A a Total 


Segregation 

B 

155,04 148,96 

304 

de B et b 

b 

150,96 145,04 

296 


Total 

306 294 

600 

valeur de % 2 est de : 




Genotype 

0 

E 

(O - E) 2 /E 

AB 

170 

155,04 

1,44 

Ab 

136 

150,96 

1,48 

aB 

134 

148,96 

1,50 

ab 

160 

145,04 

1,54 

Total 

306 

294 

X 2 = 5,97 


La valeur du % 2 est utilisee pour trouver la probabilite (p) asso- 
ciee au test, a l’aide d’une table standardisee (non presentee) de % 2 . 
De maniere generale, dans un test statistique, le degre de liberte 
(dl) correspond au nombre de valeurs independantes. Dans le 
tableau de donnees ci-dessus les totaux des lignes et des colonnes 
proviennent de resultats experimentaux. Aussi, connaitre n’importe 
quelle valeur du tableau permet d’en deduire les autres. Le dl est 
done de 1. De maniere globale, le dl est donne par le nombre de 
classes dans une ligne moins un multiplie par le nombre de classes 
dans une colonne moins un. Dans l’exemple developpe ici, la 
valeur de 5,97 est largement inferieure au seuil de probabilite de 
5 % donne dans la table du % 2 . Ainsi, l'hypothese d’un assortment 
independant (hypothese nulle) doit etre rejetee. On en conclut que 
les loci sont lies. 

6.6 HEREDITE LIEE AU SEXE 

De nombreux vegetaux ainsi que la plupart des animaux presentent un 
dimorphisme sexuel, et dans la majorite des cas le sexe est determine 
par une paire de chromosomes sexuels. Chez les humains, les cellules 
contiennent 22 paires de chromosomes homologues, les autosomes, 
et une paire de chromosomes sexuels, identiques chez la femme 
(2 chromosomes X) et non identiques chez Lhomme (1 chromosome X 
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et 1 chromosome Y). Lors de la meiose, chez la femelle les chromo- 
somes sexuels s’apparient comme les autosomes (Fig. 6.14) et se 
disjoignent de sorte que chaque ovule, revolt un chromosome X. On dit 
que la femme est de sexe homogametique. En revanche chez l’homme, 
les chromosomes X et Y s’apparient sur de courtes regions homologues, 
les regions pseudo-autosomales, et lors de la segregation donnent deux 
types de spermatozoides, une partie recevant le X et Y autre le Y. De ce 
fait, 1’homme est de sexe heterogametique. Les regions non homologues 
de ces chromosomes sont appelees regions differentielles. 


xx x Y 


1 1 


= 

p 


q 

> ( 

> < 


\ < 



> < 


Regions 
pseudo-autosomales 
(regions d’homologie 
x entre X et Y) 


Autosomes 


Chromosomes sexuels 


Figure 6.14 Region d'appariement des chromosomes sexuels chez I'Homme. 

Alors que les autosomes et les chromosomes X peuvent s'apparier sur toute leur 
longueur, seules les courtes regions telomeriques du X et du Y peuvent s'apparier au 
cours de meiose. Les regions pseudo-autosomales ont ete identifiees en observant 
I'appariement des chromosomes X et Y lors de la meiose. 


Determinisme du sexe 

La determination du sexe est genetiquement definie. En prenant I’homme 
comme exemple, un gene, SRY pour « Sex Regulation on the Y », 
localise sur le bras court du chromosome Y, joue un role crucial dans le 
determinisme du sexe. En effet, il a ete montre que l’inactivation de ce 
gene chez un individu XY aboutit a un phenotype feminin. SRY assure 
une fonction d’interrupteur et le produit de son expression est un facteur 
de transcription qui se lie sur 1’ ADN dans les gonades indifferenciees les 
transformant en testicules ; en revanche, en son absence ces memes 
gonades deviendront des ovaires. Apres formation des testicules, il 
y a activation des genes impliques dans la synthese et secretion de 
testosterone, hormone liposoluble responsable des caracteres sexuels 
secondaires masculins (forme corporelle, pilosite, etc.) propres au 
phenotype masculin. La testosterone se fixe sur son recepteur, code par 
le gene AR « Androgen Receptor » et porte par le chromosome X. 
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Le complexe testosterone-AR passe dans le noyau ou il agit sur des 
facteurs de transcriptions qui activent la transcription de genes de la 
« masculinite ». En 1’ absence du gene AR, la testosterone ne peut pas 
agir. L’individu presente un syndrome d’insensibilite aux androgenes, 
dont fait partie la testosterone, et il n’aura aucun caractere masculin. 

Heredite liee au chromosome X 

Le chromosome X contient plusieurs centaines de genes, tres peu 
etant associes a la fonction sexuelle. Un grand nombre de ces genes se 
trouvent dans la region differentielle et n’ont done pas d’equivalent 
sur le chromosome Y. Ces genes presentent un mode de transmission 
hereditaire dite transmission liee a l’X. Ce mode de transmission a ete 
mis en evidence en effectuant des croisements reciproques entre des 
drosophiles a yeux rouges et a yeux blancs : 

> En croisant des males a yeux blancs avec des femelles a yeux rouges, 
100 % des descendants de la FI ont les yeux rouges. Les individus 
de la FI croises entre eux donnent une population F2 ou 100 % des 
femelles ont les yeux rouges alors que chez les males, 50 % ont les 
yeux rouges et 50 % les yeux blancs. 

>- En effectuant le croisement reciproque, e’est-a-dire des males a 
yeux rouges avec des femelles a yeux blancs, au niveau de la FI 
toutes les femelles ont les yeux rouges et tous les males les yeux 
blancs. En croisant les individus de la FI entre eux, on obtient pour 
les males et les femelles 50 % de drosophiles a yeux rouges et 50 % 
a yeux blancs. 

Ce mode de transmission s’explique par la presence d’un gene de 
la region differentielle du chromosome X. L’ allele sauvage R est 
dominant et son produit est responsable de la couleur rouge, et V allele 
mute r est recessif, couleur blanche de l’ceil. Dans le premier croisement 
les femelles sont RR et les males r (un seul chromosome X). Tous les 
descendants de la FI heritent d’un chromosome X maternel porteur 
de F allele R, ils ont done tous les yeux rouges. En revanche, lors du 
croisement reciproque, les femelles sont rr et les males R. Les 
femelles de la FI ayant heritees du chromosome X paternel auront 
toutes les yeux rouges alors que les males heritent d’un X matemel, 
porteur de V allele recessif, et auront les yeux blancs. Ceci permet de 
comprendre les resultats obtenus a la F2. Pour le premier croisement : 

FI: 2 Rrx<3R 

F2 : 2 Rr ou RR done 100 % yeux rouges 

(? rouS d’ou 50 % de chaque phenotype 
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Les rapports phenotypiques differents pour les descendants des 
deux sexes constituent une caracteristique de l'heredite liee au sexe. 
Du fait des regions differentielles, des mutations affectant des genes 
presents dans cette region auront, meme si elles conduisent a des alleles 
recessifs, des repercutions sur la descendance. Ainsi, dans les families 
atteintes de pathologies liees a l’X on observe un desequilibre au 
niveau des arbres genealogiques. Plus d’individus males sont atteints, 
Pexemple le plus connu etant l’arbre genealogique de la reine Victoria 
et la transmission de I' hemophilic A a ses descendants. D’autres patho- 
logies sont dues a des mutations recessives du X comme la myopathie 
de Duchenne (mutation du gene codant la dystrophine), le syndrome de 
feminisation testiculaire (mutation d’unrecepteur aux androgenes), le 
daltonisme (mutation au niveau d’un photo recepteur), etc. 


6.7 TRANSMISSION DE TRANSGENES 

L’etude des genomes des organismes complexes se revele d’une extreme 
importance. L’objectif final etant l’etude approfondie du genome 
humain en vue d’apprehender les fonctions telles que les capacites 
cognitives, le comportement social, etc. En ce qui concerne l’etude de 
la fonctionnalite des genes humains, on comprend facilement que 
l’ethique n’autorise pas de mener ces etudes directement sur l’etre 
humain. Les experiences effectuees aujourd’hui concernent exclusi- 
vement des lignees cellulaires humaines cultivees in vitro et dans une 
moindre mesure la participation d’individus volontaires. Le choix d’un 
modele dont la physiologie est proche de celle de l’homme s’est done 
revele important afin d’esperer entreprendre ce type d’etudes. 

A cote des vertebres inferieurs (poissons et batraciens), le mammifere 
qui a retenu 1’ attention des geneticiens est la souris. En effet, ses 
caracteristiques sont interessantes : sa petite taille facilite son elevage, 
une femelle donne naissance a une portee de 8 a 12 petits, la duree de 
gestation est de 3 semaines et les jeunes atteignent la maturite sexuelle 
a l’age de 6 semaines. La souris possede en particulier une structure 
cerebrale complexe et un systeme immunitaire proches de ceux de 
l’homme. Ce petit rongeur est utilise depuis des decennies par les 
geneticiens. Ainsi des dizaines de mutants ont, par le passe, pu etre 
caracterises et les genes impliques ont ete localises sur le genome. La 
plupart d’entre eux ont ete clones et les fonctions, qui y sont associees 
ont ete determinees. Dans une demarche de genetique inverse, une 
technique d’ invalidation de gene, mettant a profit la recombinaison 
homologue, a pu etre raise au point chez la souris (Fig. 6.15). Les souris 
qui possedent un gene invalide sont aussi appelees souris « knock-out » 
ou mutants nuls. 
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la lignee germinale 



Figure 6.15 Methodologie generale pour la creation de souris transgeniques 
« knock-out ». 

On constate qu'il faut trois generations de souris, a partir de la mere, pour obtenir les 
individus homozygotes pour ie gene invalide (invalide/invalide). Les cellules ES utilisees 
pour la transformation sont issues d'une lignee de souris agouti (couleur du pelage 
marron). Le suivi de ce caractere permet aux geneticiens de selectionner plus facilement 
les souris chimeres portant le gene invalide en FI et les souris heterozygotes en F2. 
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La technique est basee sur Lutilisation de cellules souches 
embryonnaires (voir dans la meme collection Biologie cellulaire). Le 
gene est inactive par une strategie de recombinaison homologue 
proche de celle utilisee chez la levure (voir: figure 4.14). Dans ce cas, 
le gene d’interet est remplace par un marqueur de selection constitue 
d’un gene bacterien qui confere la resistance a un antibiotique, la 
neomycine, auquel les cellules ES sont sensibles. Le gene ainsi inva- 
lids est introduit grace a un plasmide dans les cellules ES par electro- 
poration et les cellules transferees sont selectionnees en presence de 
neomycine. Les cellules ES resistantes a la neomycine sont hetero- 
zygotes, car elles possedent un allele normal et un allele invalide. 
L’ allele normal etant dominant, les cellules se developpent norma- 
lement. Les cellules ES, ainsi modifiees, sont ensuite introduites, 
par microinjection, dans des embryons de souris au stade blastocyste. 
Les embryons sont done constitues de cellules ES normales et de 
cellules ES portant le gene invalide. Ils sont ensuite implantes dans 
E uterus d’une femelle pseudo-gestante. Celle ci va donner naissance 
a des souris chimeres, qui possederont certains tissus derivant des 
cellules ES normales et d’autres provenant des cellules ES portant le 
gene invalide. Parmi les souris chimeres, les geneticiens doivent selec- 
tionner celles dont les cellules de la lignee germinale derivent des 
cellules ES portant le gene invalide. 11 est en effet indispensable de 
transmettre le gene invalide aux generations suivantes. Ainsi, une 
souris chimere est croisee avec une souris normale, afin de rechercher 
dans la descendance les souris heterozygotes pour le gene invalide. 
Finalement, pour obtenir les souris « knock-out », il sera necessaire de 
croiser deux souris heterozygotes pour le gene invalide qui donneront 
une descendance composee a 50 % de souris heterozygotes, 25 % de 
souris homozygotes normales et 25 % de souris « knock-out », homo- 
zygotes pour le gene invalide. Comme nous l’avons vu precedemment 
chez la levure, certains genes sont essentiels a la viabilite. Chez la 
levure, le nematode ou bien la souris, un gene sur trois est essentiel a 
la viabilite. II n’est done pas possible d’obtenir une souris « knock- 
out » qui porte une invalidation pour un gene essentiel. Afin de 
contourner en partie ce probleme et permettre tout de meme 1’ etude 
de ces genes, une strategie originale a ete appliquee aux souris 
« knock-out ». 11 s’agit de l’invalidation conditionnelle des genes. 
Cette technique met a profit le systeme Cre/Lox (Fig. 6.16). 

L’enzyme Cre est une recombinase du bacteriophage Pl. Elle 
catalyse la recombinaison entre les deux sequences d’ADN de 34 pb 
appelees LoxP. Si un fragment d’ADN est place entre deux sequences 
LoxP, la proteine Cre provoquera l’excision de ce fragment d’ADN et 
d’une sequence LoxP. L’ utilisation de ce systeme in vivo necessite le 
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Figure 6.16 Invalidation conditionnelle par le systeme Cre/Lox. 

Deux sequences Lox P sont inserees dans le chromosome de la souris de part et d'autre 
du fragment a deleter (le gene B dans cet exemple). L'expression ciblee de la recombinase 
Cre permet I'excision du fragment par recombinaison homologue entre les deux sequen- 
ces Lox P. Le fragment d'ADN circulaire est elimine car il ne possede pas de centromere. 


croisement de deux lignees de souris transgeniques. Une premiere 
lignee exprime le gene Cre et la seconde le gene a invalider, flanque 
d’une sequence LoxP a chacune de ses extremites. II est possible de 
recuperer, dans la descendance, des souris qui portent les deux types 
de transgenes. L’ invalidation du gene d’interet va done dependre de 
l’expression de la proteine Cre. II est done necessaire de controler 
cette expression au cours du developpement et/ou en fonction des 
tissus. Ceci est realise en utilisant, pour l’expression de la recombi- 
nase, des promoteurs adaptes qui pourront etre actives a certains 
stades du developpement ou dans certains tissus. Ainsi, l’expression 
de la proteine Cre conduira a 1’ invalidation du gene dans le tissu ou 
l’organe cible au moment choisi par le geneticien. 





6.8 • Derives aux lois de Mendel dans la transmission des caracteres 


197 


6.8 DERIVES AUX LOIS DE MENDEL DANS LA TRANSMISSION 
DES CARACTERES 

L'epistasie 

Le phenotype d’un individu resulte pour de nombreux caracteres de 
Tmteraction entre genes. Les effets d'un gene ne peuvent etre vus en 
presence d’un allele particulier d’un autre gene. On parle d’epistasie 
pour ce phenomene ou tout type d’ interactions entre genes entraine 
une modification du rapport 9:3:3: 1 de la generation F2. De maniere 
generale, on dit que l’expression d’un gene masque l’expression de 
l’autre. Les phenomenes epistatiques se produisent uniquement lorsque 
les genes sont impliques dans la meme voie biochimique. 

A titre d’exemple chez la souris, des genes impliques dans la couleur 
du pelage peuvent interagir entre eux et modifient la couleur du pelage. 
Des souris noires de race pure ont pour genotype BBCC ou B code 
pour un pigment noir et le produit de C permet le depot de pigment. 
Les alleles recessifs b etc correspondent respectivement a des pigments 
brans et a V absence de depots de pigments. Le croisement de souris 
noires avec des souris blanches de genotype bbcc, donne des descen- 
dants FI noirs et heterozygotes : BbCc. En F2 pour un meme phenotype, 
divers genotypes sont possibles : 

> animaux noirs : BBCC, BBCc, BbCC, BbCc dans un rapport de 9/16 ; 

> animaux brans : bbCC, bbCc dans un rapport de 3/16 ; 

> animaux blancs : BBcc, Bbcc, Bbcc dans un rapport de 4/16 ; la 
couleur etant due ici a F absence de depot de pigment bee a la 
presence des deux alleles cc. 

On parle ici d’epistasie recessive. En supposant maintenant que 
1’ allele C dominant empeche le depot de pigment, les rapports seraient 
la encore modifies : 

> animaux noirs : BBcc, Bbcc dans un rapport de 3/16 ; 

> animaux brans : bbcc dans un rapport de 1/16 ; 

> animaux blancs : BBCC, BBCc, BbCC, BbCc, bbCC dans un rapport 
de 12/16. 

La presence de 1’ allele C, dominant, entraine l’absence de pigmen- 
tation et impose la coloration blanche du pelage ; on parle d’epistasie 
dominante. 

Les interactions genetiques ont done des effets sur la segregation 
des caracteres. De plus, les genes impliques dans une cascade meta- 
bolique ou biochimique peuvent etre ordonnes si pour ces genes, on 
dispose de mutations donnant des effets differents. Si le gene epistatique 
est en amont dans la voie de synthese, on constate que, par exemple, 
dans le determinisme des groupes sanguins, la mutation du gene H 
(inactivation d’une fucosyltransferase, allele recessif h) interdit la 
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syn these des antigenes A et B. Pourtant chez les individus porteurs de 
cette mutation (individus dits « Bombay » decouverts pour la premiere 
fois en Inde) le gene I responsable de la synthese des motifs biochi mi - 
ques caracteristiques des groupes A, B et AB, est de type sauvage et 
fonctionnel. C’est done bien une mutation inactivatrice du gene H qui 
impose le phenotype « Bombay » et non des mutations du gene I (voir 
chapitre 1). 

Si le gene epistatique est en aval dans la voie de synthese, comme dans 
le cas de C dominant, on constate que malgre la synthese du pigment 
son depot est inhibe, d’ou l’absence de pigmentation des souris 
portant cet allele. 

Les genes suppresseurs 

La suppression correspond a un autre type d’interaction entre genes. 
Un suppresseur est l’allele mutant d’un gene qui inverse l’effet de la 
mutation d’un autre gene en redonnant un phenotype sauvage. Diffe- 
rents evenements peuvent conduire a la suppression. Une mutation 
peut intervenir dans le gene mute et restaure sa fonctionnalite, on parle 
de suppresseur intragenique ; une mutation peut affecter un autre gene 
que le gene mute et restaurer egalement le phenotype sauvage, il 
s’agit d’un suppresseur extragenique. Les suppresseurs extrageniques 
ne modifieront le phenotype que chez les doubles mutants. 

A titre d’exemple chez la drosophile une mutation au niveau du gene 
Pel conduit a un allele recessif pel qui a l’etat homozygote modifie la 
couleur de l’oeil en l’absence de suppression. Un allele mute, su, du 
gene Su, ne genere pas en lui-meme le phenotype detectable, mais en 
revanche modifie l’effet de l’allele pd. Si on croise des individus 
PdPdsusu (yeux rouges) avec des individus pdpd SuSu (yeux violets), 
la FI est double heterozygote. Les individus de la FI croises entre eux 
vont donner des descendants de phenotypes : 

>- Yeux rouges dans un rapport de 13/16 ; ce phenotype correspond 
aux individus PdPdSuSu, PdpdSuSu, PelPd Susu, PdpdSusu, PdPd- 
susu, Pdpdsusu, et pdpdsusu. Chez ces derniers la presence du 
suppresseur su corrige l’effet de la mutation pd. 

>- Yeux violets dans un rapport 3/16 apporte par les individus de 
genotype : pclpclSusu, pdpd SuSu. 

Dans l’exemple choisi, on a un suppresseur recessif qui agit sur une 
mutation recessive. 11 existe des suppresseurs dominants et recessifs 
qui peuvent agir sur des mutations dominantes ou recessives. Bien que 
l’on puisse confondre la suppression avec l’epistasie, les rapports obtenus 
en F2 different et permettent de distinguer les deux phenomenes. 
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>- La mitose concerne a la fois les cellules haploides et diploides. Elle aboutit 
a deux cellules filles genetiquement identiques a la cellule mere. 

>• La meiose ne peut exister que pour des cellules obligatoirement diploides 
et aboutit a partir d'une cellule mere diploide a quatre cellules haploides 
genetiquement differentes entre elles. 

>• La recombinaison meiotique designe tout processus meiotique qui donne 
un produit haploide presentant une combinaison d'alleles differente de 
celle portee par les genotypes haploides a I'origine du meiocyte. 

>• L'analyse de la descendance a I'issue d'un croisement test ou « test-cross » 
permet d'identifier les recombinants dont les phenotypes different de ceux 
des parents PI. 

>- Les recombinants sont produits par deux processus distincts : I'assortiment 
independant et les crossing-over. 

>- Le brassage interchromosomique correspond a une redistribution aleatoire 
des chromosomes parentaux lors de I'anaphase de la premiere division 
meiotique. 

>- La recombinaison intrachromosomique accroit encore un peu plus la 
diversite genetique des populations ulterieures. 

>- La frequence de recombinaison entre deux loci reflete la distance genetique 
qui les separe sur le meme chromosome. 

>- ^interference traduit le fait qu'un crossing-over diminue la probabilite 
qu'un deuxieme crossing-over se produise dans une region tres proche. 

>- Les ascospores sont reparties dans un asque lineaire en fonction du profil 
de segregation resultant des deux divisions meiotiques. Si un crossing-over 
s'effectue entre un locus et un centromere, les ascospores seront reparties 
par bloc de deux en fonction des chromatides impliquees dans la recombi- 
naison. On peut ainsi realiser la cartographie des centromeres. 

>- Des mutations facilement identifiables comme des inversions sur un chromo- 
some polytene contribuent a la determination de la position approximative 
de I'allele mute responsable d'un nouveau phenotype. 

>- Le test du x 2 constitue un moyen de quantifier les differents ecarts attendus, 
lies au seul fait du hasard, entre une valeur predite et celle obtenue experi- 
mentalement, si I'hypothese est vraie. 

>- Les chromosomes X et Y s'apparient sur de courtes regions homologues, 
les regions pseudo-autosomales ; les regions non homologues de ces 
chromosomes sont appelees regions differentielles. 

>- Le gene SRY , « Sex Regulation on the Y », localise sur le bras court du chromo- 
some Y,joue un role crucial dans le determinisme du sexe masculin. 
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> Un grand nombre des genes portes par le chromosome X se trouve dans la 
region differentielle, ils n'ont done pas d'equivalent sur le chromosome Y. 
Ils presentent un mode de transmission hereditaire dite transmission liee a I'X. 

>- Les rapports phenotypiques differents pour les descendants des deux sexes, 
observes apres des croisements reciproques, constituent une caracteristique 
de I'heredite liee au sexe. 

>- Dans une demarche de genetique inverse, une technique d'invalidation de 
gene, mettant a profit la recombinaison homologue,a pu etre mise au point 
chez la souris. Les souris qui possedent deux copies d'un gene invalide 
sont appelees souris « knock-out » ou mutants nuls. 

>- L'epistasie traduit la situation dans laquelle I'expression phenotypique 
differentielle d'un genotype a un locus est sous la dependance d'un autre 
locus. 

>- Un suppresseur est I'allele mutant d'un gene qui inverse I'effet de la mutation 
d'un autre gene en redonnant un phenotype sauvage. 


QCM - QROC 

6.1 Quelle affirmation est exacte ? 

a) Par division mitotique, une cellule genere deux cellules filles gene- 
tiquement differentes. 

b) La mitose est reservee exclusivement aux cellules diploides. 

c) Au cours de la meiose, il y deux replications de l’ADN puis une 
seule division cellulaire. 

d) La meiose est a l’origine de la diversite genetique des individus 
d’une meme espece. 

6.2 Les affirmations suivantes sont-elles vraies ou fausses ? 

a) Au cours de la prophase de la l re division meiotique les chromosomes 
sexuels chez 1’homme s’apparient sur toute leur longueur. 

b) Au cours de la prophase de la l re division meiotique les chromosomes 
sexuels chez la femme s’apparient sur toute leur longueur. 

c) La division reductionnelle concerne la separation des chromatides 
d’un chromosome, et la division equationnelle la separation des 
chromosomes homologues. 

d) Les crossing-over s’effectuent entre chromosomes homologues lors 
de la l re division meiotique. 

6.3 Parmi les propositions suivantes, quelles sont celles qui sont vraies ? 
a) Les mecanismes de recombinaison genetique peuvent generer plus 
de 50 % de recombinants. 
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b) Deux genes lies sont portes par des chromosomes differents. 

c) Les frequences de recombinaison entre deux loci permettent d’estimer 
la distance qui les separe sur un chromosome. 

d) La distribution des ascospores de meme genotype dans un asque 
lineaire est toujours identique. 

e) La presence de doubles crossing-over dans une meme region inter- 
fere sur le calcul des distances genetiques entre les caracteres etudies. 

f) Le test du % 2 valide, sur la base d’une hypothese vraie, la part du 
hasard dans les distributions phenotypiques observees par rapport a celle 
attendues. 

6.4 Chez les humains, lorsque des caracteres sont portes par la region 
differentielle du chromosome X : 

a) Le pere transmettra les alleles de ces caracteres a ses fils. 

b) Si une femme, porteuse saine, se marie avec un homme sain, la 
probabilite d’ avoir un fils normal est de 25 %. 

c) Pour les caracteres analyses, le phenotype des filles dependra exclu- 
sivement du genotype maternel. 

d) Si une mutation affecte l’un des caracteres, le phenotype qui en 
resulte sera majoritairement observe chez les descendants males. 
Quelles affirmations pouvez-vous retenir ? 

6.5 Retenir les propositions correctes. 

a) Les interactions geniques peuvent masquer des phenotypes. 

b) Les genes epistatiques masquent les phenotypes. 

c) Dans le cas d’epistasie dominante, par croisement entre individus 
d’une FI, une forte partie d’entre eux sera de phenotype sauvage. 

d) Les genes suppresseurs ont toujours pour cibles les alleles recessifs 
d’autres genes. 

6.6 Si sur des individus AaBb d’une FI, issue d’un croisement AABB 
x aabb, on effectue un croisement test, au niveau de la descendance 
quel pourcentage sera Aabb si : 

a) les genes sont non lies ; 

b) les genes sont lies et distants de 20 cM ; 

c) trop proche pour qu’il y ait un crossing-over. 

6.7 Un allele recessif h, porte par le X, est responsable de l’hemophilie, 
une femme saine dont la mere est hemophile epouse un homme normal. 
Quelle est la probabilite d’ avoir un fils hemophile ? 
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6.8 La synthese de pigments rouges chez les fleurs se fait en deux 
etapes : 

geneP gene Q 

Pigments blancs — > Pigments magenta -> Pigments rouges 
Mutes les genes P et Q codent des produits incapables d’ assurer pour 
P allele p la synthese de pigment magenta et q celle de pigment rouge. 
Pour les deux genes les mutations sont recessives. 

a) Quelle sera la couleur de la fleur d’une plante de genotype PPqq, et 
celle d’une plante de genotype ppQQ. 

b) A quels rapports phenotypiques doit-on s’attendre en croisant des 
plantes QqPp entre elles ? 


REPONSES 


6.1 d) Vrai ; b) les organismes haploides comme la levure se divisent 
par mitose 

6.2 b) et d) vraies 

6.3 c), e) et f) vraies ; a) il ne peut jamais y avoir plus de 50 % de 
recombinants ; d) la distribution des ascospores peut varier si des 
crossing-over s’effectuent entre le centromere et un locus donne. 

6.4 b) et d) vraies ; a) faux car le pere ne peut pas transmettre de 
chromosome X a ses fils ; c) faux, si la mere est heterozygote An et le 
pere a, les hlles auront deux genotypes possibles An ou act qui donneront 
des phenotypes distincts. 

6.5 a) et b) vraies ; c) faux : la majeure partie sera de phenotype mute 
impose par la presence de 1’ allele dominant du gene a effet epistatique ; 
d) faux : ils peuvent egalement agir sur des alleles sauvages. 

6.6 a) 25 % des gametes de la FI seront de genotype Ah, la contribution 
de F autre parent lors d’un croisement test etant ab, 25 % des individus 
auront le genotype Aabb ; b) la distance qui separe les deux caracteres 
etant deduite des frequences de recombinaison, au niveau de la FI les 
recombinants possibles sont aB et Ab, et represented au total 20 % de 
la descendance. Done, la moitie des recombinants, soit 10 % des indi- 
vidus de la population analysee seront Aabb ; c) aucun individu ayant 
ce phenotype ne sera observe du fait de F absence de crossing-over. 

6.7 25 % : la mere est heterozygote (saine mais de mere hemophile), 
done Hh ( H designant F allele sauvage dominant). II y a une chance sur 
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deux qu'elle transmette L allele li et egalement une chance sur deux 
que 1’ enfant soit un fils ; 1/2 x 1/2 = 1/4 soit 25 %. 

6.8 a) Une plante de genotype PPqq ne pourra pas transformer les 
pigments magenta en pigments rouges du fait de la mutation de L allele q 
present a l’etat homozygote. Les fleurs seront de couleur magenta. 
Celle de genotype ppQQ, malgre la fonctionnalite du gene Q, n’aura 
aucun pigment magenta, intermediate dans la voie de synthese, done 
les fleurs seront blanches. 

b) 9 : 4 : 3. En faisant le tableau de croisement on en deduit : 9/16 de 
plantes a fleurs rouges (1/16 PPQQ + 2/16 PPQq + 5/16 PpQq + 1/16 
PpQQ) ; 4/16 de plantes a fleurs blanches (1/16 ppqq + 1/16 ppQQ + 
2/16 ppQq) ; 3/16 de plantes a fleurs magenta (1/16 PPqq + 2/16 Pqqq). 
Nous sommes ici dans un cas d’epistasie recessive, ou l’absence d’un 
produit fonctionnel en amont de la voie de synthese bloque la formation 
des pigments. 
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7.1 Genetique de revolution 

7.2 Une breve histoire de I'origine des genes 

7.3 La boite a outils genetiques du developpement 

7.4 D'ou vient la nouveaute en matiere de developpement 

> Definir la notion devolution 

> Etablir les relations entre revolution et la genetique du developpement 
des organismes 

> Aborder I'origine et 1'evolution de la structure des genes 

> Aborder les mutations dans la regulation des genes comme source de 
nouveaute evolutive 


7.1 GENETIQUE DE DEVOLUTION 

L’ evolution selon Darwin repose sur la selection naturelle. Depuis sa 
formulation en 1859, cette expression toute simple a fait couler beau- 
coup d’encre. Sa comprehension contemporaine, defendue par la plupart 
des biologistes, s’appuie sur le constat que les seuls individus qui 
survivent (qui sont selectionnes) sont ceux qui, dans un environnement 
changeant, sont les plus aptes a se reproduire parce qu’ils y sont les 
mieux adaptes. L’ environnement exerce done un tri, une selection qui 
provoque une evolution en faisant apparaitre des adaptations. La 
selection peut s’exercer a differents niveaux d’organisation des etres 
vivants : celui du materiel genetique, acides nucleiques et proteines 
ainsi que leurs complexes geniques et chromatiniens et ceux de la 
cellule, de Lorganisme ou de la population. La selection precede selon 
un tri, un echantillonnage, caracterise par son caractere aleatoire. En 
effet, parmi les innombrables potentialites theoriques offertes par la 
combinatoire des variations (mutations) de tous types, seul un petit 
nombre est conserve a chaque generation et dans ce processus ou 
derive genetique, le hasard joue un role essentiel. 
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Macro et microevolution : aper^u general et definitions 

D’un strict point de vue genetique, les deux mecanismes importants 
qui alimentent les changements de frequence des alleles au sein d’une 
population sont : (i) la derive genetique (le tri aleatoire) et (ii) la 
selection reproductive liee a l’environnement. Meme en l’absence de 
selection, le tri aleatoire des mutations transmises entre les genera- 
tions conduira progressivement a ce que la frequence d’un allele 
tende vers 100 % (allele fixe) ou 0 % (disparition de 1’ allele) et ce 
d’autant plus efficacement que la population sera de petite taille. Pour 
des populations de plus grande taille, c’est le mecanisme de selection 
naturelle qui predominera. Quelle qu’en soit la cause, le changement 
de taille d’une population aura done un effet important sur sa capacite 
a evoluer par selection naturelle. Celle-ci suppose en effet : 

> qu'une variability heritable naturelle existe au sein de la population 
consideree ; 

> que les individus engendrent plus de descendants qu’il n’en peut 
survivre ; 

> qu’au sein de la population, les individus varient dans leur capacite 
a survivre et a se reproduire ; 

>• que les reproducteurs les plus actifs transmettent leurs caracteristiques 
genetiques a leurs descendants alors que les moins actifs ne le font 
pas. 

Si ces diverses caracteristiques contribuent a augmenter 1’ adaptability 
evolutive des individus qui les possedent, ils survivront et se reprodui- 
ront plus efficacement que les autres. Inversement les caracteristiques 
qui amoindriront 1’ adaptability des individus qui en sont porteurs 
contribueront a rareher la representation de ces derniers au sein de la 
population. 

On designe par le terme de macroevolution celle qui intervient au 
niveau de l’espece ou a un niveau superieur. Typiquement la macro- 
evolution fait reference aux changements qui modifient l’embryogenese, 
les plans d’ organisation, les principales caracteristiques des individus 
et qui sont a la base de la phylogenie des grands groupes du monde 
vivant. La microevolution par contre designe au sein d’une population 
des changements evolutifs de moindre ampleur comme ceux qui sont 
relatifs a la frequence des alleles. Les biologistes considerent que macro- 
evolution et microevolution sont bees par le fait que 1’ accumulation 
graduelle de petits changements entraine les changements de plus 
grande ampleur, meme si des sauts evolutifs rapides sont egalement 
visibles dans les traces paleontologiques. 

Certains biologistes, peu nombreux mais tres actifs et relayes par des 
mouvements religieux, surtout aux USA, admettent l’existence des petits 
changements evolutifs, mais rejettent l’idee d’une macroevolution qui 
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s’oppose, a leurs yeux, a l’existence d’un dessein intelligent (« intelli- 
gent design ») qui n’est, a vrai dire, que la forme moderne de la 
creation ex nihilo du monde vivant suivant les dogmes des principales 
religions monotheistes. Ce mouvement antievolutionniste fait echo en 
ce debut de xxi e siecle a la montee des fondamentalismes religieux 
radicaux. 

Les racines d'une nouvelle discipline : I'evo-devo 

L’ etude des processus genetiques intervenant lors du developpement 
des organismes a donne naissance a un courant scientifique tres 
fecond qui s’efforce d’etablir un lien entre l’origine des changements 
observes au cours du developpement des organismes depuis l’oeuf 
feconde jusqu’a l’adulte et revolution des genes conduisant a l’appa- 
rition des especes. Cette discipline beneficie aujourd’hui des progres 
considerables decoulant (i) de la decouverte des genes controlant notam- 
ment le developpement embryonnaire precoce et (ii) des connaissances 
de plus en plus nombreuses apportees par le sequencage complet des 
genomes. 

devolution du developpement biologique, ou en abrege l’evo-devo, 
se propose done de comparer les processus developpementaux des 
organismes vivants (animaux et des plantes). Elle essaie de determiner 
les relations ancestrales qui existent entre les organismes et comment 
ces processus ont evolue. L’evo-devo aborde ainsi l’origine et revolution 
du developpement embryonnaire. Elle analyse comment les changements 
dans le developpement et les processus qui le diligent ont produit de 
nouvelles caracteristiques biologiques. Elle s’interesse au role de la 
plasticite developpementale dans revolution et comment l’ecologie 
intervient dans ces phenomenes. 

Bien que la vieille theorie d’Ernest Haeckel qui affirmait au 
xix e siecle, que « l’ontogenie recapitule la phylogenie » - e’est-a-dire 
que le developpement d’un organisme reflete exactement revolution 
de son espece - soit depuis longtemps rejetee, certains biologistes 
admettent cependant l’existence de nombreuses filiations evolutives 
entre ontogenie et phylogenie. Les mernes processus generaux agiraient 
dans l’un et 1’ autre cas comme, par exemple, la reutilisation d’anciens 
genes et reseaux de genes pour creer de nouvelles structures et de 
nouveaux reseaux. Une sorte de recyclage des instructions geniques 
qui ressemble a un bricolage (« faire du neuf avec de l’ancien ») selon 
1’ expression de F. Jacob. Le principal interet de cette demarche 
consistait a l’origine a mettre en evidence l’homologie des mecanismes 
moleculaires et cellulaires qui controlent la construction des organismes 
puis le developpement. Aujourd’hui la demarche s’applique a tous les 
aspects et echelles de revolution. 
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7.2 UNE BREVE HISTOIRE DE L'ORIGINE DES GENES 

L'ARN a-t-il precede I'ADN comme support moleculaire 
de I'heredite ? 

Le monde ARN est une hypothese resultant de l’idee que l’evenement 
le plus critique se rapportant a rorigine de la vie repose sur 1’ emer- 
gence d’une molecule autoreplicative, une molecule qui puisse a la 
fois se copier elle-meme et muter c’est-a-dire evoluer pour accroitre 
l’efficacite de sa propre replication. L’ evolution fonctionne en effet 
sur la base de la variation et de la selection et cette derniere se mesure 
toujours sous le sceau de la multiplication la plus efficace, la capacite 
a faire la meilleure entite en question possible. 

Dans le monde d’aujourd’hui, I’ADN est le premier materiel gene- 
tique. II est traduit grace a un dispositif faisant appel a l’ARN et a un 
mecanisme de synthese proteique specifiant la position de 20 amino- 
acides dans les proteines enzymes. Trois systemes moleculaires done 
qui creent le paradoxe de ne pas livrer la cle du commencement. Ce 
paradoxe est cependant en passe d’etre resolu aujourd’hui a la suite de 
deux decouvertes capitales. La premiere est que 1’ ARN est une molecule 
biochimiquement plus primitive que I’ADN. La seconde est que l’ARN 
est capable d’effectuer le transfert de la liaison phosphodiester neces- 
saire a sa propre synthese et possede ainsi une capacite enzymatique a 
l’instar des proteines. 

En appui de la premiere decouverte, il faut noter aussi que les desoxy- 
ribonucleotides sont obligatoirement synthetises a partir de ribonucleo- 
tides precurseurs, que la synthese de I’ADN necessite des amorces ARN 
et que lorsqu’il s’agit de terminer la synthese de I’ADN chromosomal 
a l’extremite 3’ de la chaine ADN e’est une telomerase qui fonctionne en 
copiant une matrice ARN (voir le Mini Manuel de Biologie moleculaire). 

L’hypothese d’un monde initial ou ce serait les proteines qui diri- 
geraient le transfert de l’information est tres fortement improbable. 
Aucune forme d’interaction entre proteines n’est en effet connue, 
comme pouvant etre apte a se copier, se repliquer et muter comme 
EARN. L’ aspect le plus decisif de 1’ evolution moleculaire primitive 
reside dans la capacite des molecules a croitre c’est-a-dire a s’auto- 
repliquer dans des conditions compatibles avec la variation et la 
mutation, a foumir des nouveautes sur lesquelles la selection naturelle 
pourra operer alin d’ameliorer la replication dans un environnement 
changeant. C’est EARN qui reunit le mieux et de loin les proprietes 
necessaires a l’emergence des molecules a partir desquelles se construi- 
ront les premiers systemes. Ces demiers doivent avoir la double propriete 
d’etre depositaires d’une information genetique et etre aptes a la mettre 
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en oeuvre a la fois pour la transmettre par autoreplication, l’ameliorer 
par mutation et l’exprimer en diverses fonctions par ses proprietes de 
catalyse. 

La question capitale concernant le monde ARN est le classique 
paradoxe de la taille necessaire pour fonctionner comme une enzyme. 
Une enzyme ARN devrait avoir une taille de 300 a 600 nucleotides 
pour, par la creation de sites actifs, etre reellement apte a realiser 
diverses fonctions catalytiques. Or, il parait peu vraisemblable qu’une 
telle creation resulte d’un jeu aleatoire de 4 300 possibility, soit 10 180 
molecules. Walter Gilbert propose pour surmonter cette difficulty une 
solution qui recueille l’adhesion d’un nombre grandissant de biolo- 
gistes moleculaires : les premieres molecules d’ARN avaient une 
structure intron-exon. 

Origine des introns et des exons, structure des genes 
et evolution 

Selon cette theorie, le materiel genetique ARN serait forme de courts 
modules, composes chacun de 30 a 40 bases (des exons ARN en quelque 
sorte), reunis par des introns ARN autoepissables. Cette structure 
lineaire serait bien adaptee a la formation d’une copie. Apres l’operation, 
les introns s’autoepisseraient pour laisser ensemble une serie d’ exons 
qui se replieraient de telle maniere a former un ribozyme. La presence 
d’introns resout trois difficultes et tout d’abord, celle du paradoxe de 
la taille de l’ARN. En effet, par le jeu d’un assemblage d’ exons de 
petite taille (30 a 40 bases) une molecule a fonctions complexes peut 
en resulter. En second lieu, un moyen est fourni permettant de distinguer 
le materiel qui doit etre copie pour produire des descendants, du 
materiel qui apres epissage, se replie pour donner un ARN a fonction 
enzymatique. Enfin un materiel est obtenu qui en favorisant les recom- 
binaisons illegitimes, stimule l’obtention de mutations selectionnables. 

L’ aspect particulierement novateur de ce modele reside dans la 
formation d’une structure intron-exon apte a realiser une transposition 
d’exons. En effet, dans l’hypothese d’un autoepissage embarquant les 
deux introns enserrant un exon (Fig. 7.1) un transposon se forme qui 
peut se recombiner avec un autre intron present au sein d’un gene 
ARN primitif accepteur. Un brassage d’exons en resulte, processus 
considere aujourd'hui comme essentiel dans la formation des nouveaux 
genes au cours de revolution. L’ origine de ce type d’evenement se 
situerait ainsi des les premiers mecanismes moleculaires ayant conduit 
a l’emergence des premiers genomes dans un monde ARN. 
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Figure 7.1 Representation schematique d'une structure intron-exon au niveau 
d'un ARN primitif autoepissable. 

Alternativement : (i) les deux introns sont episses pour produire un ribozyme (ii) les 
extremites eloignees des deux introns epissent ensemble et produisent un exon 
d'intervention qui pourra occuper une nouvelle position au sein d'un nouveau gene. 


7.3 LA BOiTE A OUTILS GENETIQUES DU DEVELOPPEMENT 

Ce sont les differents alleles des genes dits du developpement qui 
dirigent le plan architectural du corps, le nombre, l’identite et la forme 
des differentes parties des organismes multicellulaires. Ces genes sont 
hautement conserves parmi les grands phylums animaux. Us ne repre- 
sentent cependant qu’une petite fraction des genomes. 


Figure 7.2 Organisation et expression des genes HOX chez la drosophile et 
la souris. 

Les huit genes homeotiques de la souris sont organises en deux clusters (complexes 
de genes). Cinq des huit genes sont localises dans le complexe Antermapaedia et 
les trois autres dans le complexe Bithorax. II y a une correspondance colineaire 
entre I'ordre des genes homeotiques ie long du chromosome et les profils depres- 
sion selon I'axe antero-posterieur des embryons. Ainsi le gene lab, en position la 
plus extreme en 3'du complexe Antennapaedia s'exprime dans la partie ia plus >- 
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> anterieure de la tete de I'embryon. Au contraire, le gene Abd-B, en position la plus 5' du 
complexe Bithorax est exprime dans la region la plus posterieure. La signification de 
cette colinearite n'est pas etablie mais elle observee pour tous les embryons y compris 
chez les mammiferes et I'homme. La souris possede 38 genes Hox organises en quatre 
clusters (un seul est presente ici, le cluster Hoxb).Chaque cluster contient 9 ou 1 0 genes 
homeotiques qui correspondent a chaque gene du cluster de la drosophile, avec le 
meme type de colinearite. Comme la souris, I'homme possede quatre clusters de 
genes Hox avec les memes caracteristiques : HOXA (Chr 7), Hoxb (Chr 17), HoxC (Chr 
12), HOXD (Chr 2). 
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Ils participent a des voies de signalisation, codent des facteurs trans- 
criptionnels, des proteines de T adhesion cellulaire, des recepteurs de la 
surface cellulaire et des morphogenes. Leurs fonctions sont fortement 
correlees a leurs profils d’expression dans le temps et dans l’espace. 
L’evo-devo se propose d’identifier tous ces genes en s’attachant a definir 
leurs identites, produits, fonctions et interactions. A titre d’exemple, les 
genes HOX (Fig. 7.2) , qui appartiennent a l’une des families les plus 
importantes codent des facteurs de transcription dont la sequence 
comporte des homeoboites. II s’agit de l’un des motifs de liaison aux 
proteines les plus largement distribues parmi les genes du developpe- 
ment. Ils participent a la formation des axes de symetries antero-poste- 
rieure et dorso-ventrale du corps. En specifiant l'identite des differentes 
regions du coips, les genes HOX determinent la ou les membres et autres 
segments du corps doivent se former chez l’embryon ou la larve. Des 
mutations dans l’un de ces genes conduisent a la formation d’ appen- 
dices sur-numeraires non fonctionnels chez les invertebres. C’est le cas 
notamment de mutations dans le complexe aristapedia chez la droso- 
phile. Ces mutations provoquent sur la tete, la formation d'une patte a la 
place d’une antenne (mutation connue sous le nom d’ Antennapaedia). 

Les genes a homeoboites ont ete tout d’abord identifies chez les 
animaux a symetrie bilaterale. Certains genes de Cnidaires, un groupe 
animal tres primitif, possedent egalement des domaines a homeoboites, 
ce qui au-dela d’apporter le chainon manquant dans 1’ evolution des 
etres vivants, apporte une preuve supplementaire sur la maniere dont 
precede 1’evolution pour faire du neuf a partir du vieux, tout en 
conservant ce qui « marche ». 

Les genes homeotiques des plantes - les genes a boites MADS - ne 
sont pas homologues des genes HOX animaux. Plantes et animaux ne 
partagent done pas les memes genes homeotiques, ce qui suggere que 
les genes homeotiques sont apparus deux fois au cours de 1’evolution. 

La regulation des genes HOX s’avere tres complexe. Elle implique 
des interactions reciproques pour la plupart inhibi trices. 

Les genes du developpement 

Tous les animaux debutent leur vie sous la forme d’une cellule unique, 
et pour cette raison, l’embryon s’auto-organise au cours du develop- 
pement pour donner naissance aux nombreux types cellulaires differents, 
trouves chez l’adulte. L’ auto-organisation implique une serie d’inter- 
actions geniques qui assemblent les cellules d’une maniere qui prefigure 
le plan du corps adulte. Des evenements de remodelage redistribuent 
les cellules en tissus specifiques, et l’expression de batteries de genes 
indispensables aux fonctions cellulaires specialisees dirige ensuite 
les processus de differenciation. Le fa^onnage embryonnaire et la 
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differenciation finale sont integres par de vastes reseaux de regulation 
genique qui controlent par exemple les divisions asymetriques ou la 
signalisation entre cellules, grace a des combinaisons de facteurs de 
transcription qui stimulent ou repriment leurs genes cibles en se liant 
aux sequences ds-regulatrices. Si les genes cibles codent eux-memes 
des facteurs de transcription, ils controleront alors d’autres genes 
cibles si bien que le developpement peut se comparer a un vaste reseau 
transcriptionnel ou l’information ds-regulatrice serait la composante cle. 

La notion d'homeobolte 

Une homeoboite est une courte sequence d’ADN localisee au sein d’un 
gene implique dans la regulation du developpement des animaux, 
champignons et plantes. Ces genes sont nommes, pour cette raison, 
« genes a homeoboites ». Ils ferment la famille des genes homeotiques. 

La sequence ADN d’une homeoboite possede environ 180 paires 
de bases et code un domaine proteique (l’homeodomaine) qui se lie a 
d’autres sequences d’ADN, d’ou le nom generique de proteines de 
liaison a l’ADN. Les genes homeotiques codent en general des facteurs 
de transcription qui activent a leur tour la transcription d’autres genes 
qui participent aux cascades necessaires a la formation d’une patte, 
par exemple. La proteine contenant une homeoboite se fixe a sa cible 
ADN d’une maniere specifique. Habituellement cela ne suffit pas 
cependant pour qu’une proteine possedant une seule homeoboite 
reconnaisse specifiquement son gene cible. Les proteines a homeo- 
domaines agissent en effet generalement sous la forme de complexes 
avec d’autres facteurs de transcription, eux-memes contenant des 
homeoboites, pour se her a la region promotrice de leurs genes cibles. 
Ces complexes ont des specificites beaucoup plus elevees qu’une seule 
proteine a homeodomaine. 

La notion de morphogene 

Cette notion ancienne ne designe pas une categorie particuliere de 
biomolecules, mais plutot une substance qui controle la maniere dont 
se developpe un tissu et comment se positionnent les differentes 
cellules specialisees qui le composent. Un morphogene diffuse gene- 
ralement a partir d’une cellule emettrice. 11 forme un gradient de 
concentration au sein du tissu cible en developpement. Cette notion a 
ete popularisee, il y a une cinquantaine d’annees, par Lewis Wolpert 
qui a decrit comment un morphogene subdivisait un tissu en domaines 
cibles de l’expression de differents genes, un peu a la maniere des 
couleurs d’un drapeau. Le premier morphogene a etre identifie fut un 
facteur de transcription dont le gradient, dans l’embryon syncitial de 
drosophile, participe a la definition de l’axe antero-posterieur de 
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T animal (voir plus loin). Un autre morphogene, homologue du TGFp, 
nomme chez la drosophile Decapentaplegic (Dpp), fut ensuite identifie. 
11 agit aux stades tardifs du developpement embryonnaire de la mouche. 

Les gradients de morphogenes engendrent, au cours du develop- 
pement de la mouche, differents types cellulaires. 11s facjonnent 
I'organisation spatiale de l’embryon. Le morphogene subdivise, par 
l’effet d’un gradient de concentration, un champ de cellules a qui il 
fournit de ce fait une information spatiale qui induit ou maintient les 
mecanismes moleculaires de F expression de differents genes cibles 
sensibles a differents seuils de concentration (Fig. 7.3). 



Activation des 
recepteurs 


Cellule 1 


Cellule 2 




Cellule 3 




Niveau 

de transcription 
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Figure 7.3 Un cluster de cellules libere une molecule de signalisation, le morpho- 
gene, qui diffuse vers les cellules cibles a travers la matrice extracellulaire. 

Selon leur position plus ou moins distante du massif cellulaire emetteur, les cellules 1 , 2 et 
3 resolvent des quantites differentes de morphogene. Le nombre de recepteurs de surface 
qui seront actives varie avec la distance et par voie de consequence, les cellules 
contiendront de moins en moins de proteines regulatrices (facteurs de transcription par 
exemple) dans leur noyau. Une correlation iineaire peut ainsi s'etablir entre la quantite 
de morphogenes lies par les recepteurs et le niveau de transcription des genes cibles. 
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Les cellules, les plus eloignees de la source de morphogene, 
recevront une faible concentration de morphogene et exprimeront les 
seuls genes sensibles a ce faible niveau. Au contraire, les cellules les 
plus proches de la source seront au contact de fortes concentrations de 
morphogene et exprimeront les genes sensibles a toutes les concentra- 
tions faibles et fortes. Differentes cellules seront ainsi conduites a 
se differencier, en reponse a des combinaisons de morphogenes de 
concentrations tres variees. Le champ initial de cellules, se subdivisera 
en differents types cellulaires, suivant la position des cellules vis-a- 
vis de la source de morphogene. II s’agit la d’un mecanisme general, 
responsable de la diversite des types cellulaires engendres au cours du 
developpement d’un animal. Les morphogenes les mieux connus sont 
des facteurs de transcription, mais la plupart sont des proteines secretees 
qui activent des voies de signalisation croisees entre les cellules cibles. 

Le modele historique de la drosophile 

Tous les animaux actuels sont organises suivant des axes de symetries 
antero-posterieure et dorso-ventrale qui temoignent en quelque sorte 



Gradient de orthodenticle Gradient de Hunchback 


Figure 7.4 Exemple de I'intervention d'un gene a effet maternel, le gene Bicoid, 
dans la formation de I'axe de symetrie antero-posterieure de la mouche. 

a. Le gradient de la proteine bicoid, un facteur de transcription, engendre differents 
niveaux d'expression des genes cibles, orthodentide et hunchback. Seules de fortes con- 
centrations de bicoid stimulent orthodenticle dans la tete de I'embryon. Hunchback est 
stimule par des concentrations elevees et moyennes de bicoid, dans la tete et le thorax. 
Les deux genes possedent des sites ADN regulateurs en 5' (« enhancers ») qui fixent la 
proteine bicoid et stimulent la transcription du gene en aval. Mais les trois sites « enhan- 
cers » de chacun des genes n'ont pas la meme affinite pour bicoid. Les sites de ortho- 
denticle sont de faible affinite alors que les sites de hunchback sont a haute affinite. 
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Gradient de orthodenticle 


Gradient de Hunchback 


b. Dans les parties centrales de I'embryon, le gene orthodenticle n'est pas stimule 
car la concentration de la proteine bicoid n'est pas suffisante pour qu'une liaison 
avec les sites en 5' de faible affinite se produise. Pour hunchback c'est le contraire, 
car la concentration de bicoid est suffisante pour que la proteine se lie avec les sites en 
5'de haute affinite du gene. Les proteines orthodenticle et hunchback sont aussi desfac- 
teurs de transcription qui controlent avec des effets de gradients (indiques en noir 
grise) d'autres genes du developpement qui participent a leur tour par leurs produits 
au fa^onnage de I'embryon de la mouche. 


de lareussite complete au cours de revolution d’un type d’organisation 
base sur un plan de symetrie bilaterale et une segmentation polarisee 
(Fig. 7.4, Fig. 7.5 et 7.6 ) dont le faqonnage est controle par des genes 
tres particuliers. Ainsi, les produits des genes a effet maternel, ARNm 
ou proteines, sont synthetises dans les tissus maternels entourant I 'ovule 
(cellules folliculaires) puis importes dans ce dernier ou, en associa- 
tion avec les produits des genes embryonnaires homologues, leur 
distribution spatiale faqonnera le plan du futur embryon et de l’adulte, en 
activant les reseaux de genes appropries. Le decryptage des principaux 
mecanismes genetiques a I’origine du fagonnage precoce de I’embryon 
de la drosophile (mouche du vinaigre) constitue l’une des plus belles 
decouvertes de la genetique du developpement. 

Le developpement de Drosophila melanogaster commence par une 
serie de treize divisions nucleaires qui ne sont pas accompagnees par 
la formation de cellules. L’ embryon reste en effet une cellule unique 
avec 8 000 noyaux disposes pres de la membrane jusqu’a la 14 e division. 
A ce stade les membranes apparaissent et isolent les noyaux en cellules 
distinctes. Les facteurs de transcription, comme bicoid ou hunchback, 
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Figure 7.5 Exemple de I'intervention des trois genes sog, rhomboid et twist, dans 
la formation de I'axe de symetrie dorso-ventrale de I'embryon de mouche. 

Dans le cytoplasme syncitial (nombreux noyaux en I'absence de cellules) de I'embryon, 
la proteine Dorsal, un facteur de transcription, est fortement concentree en partie dorsale 
et faiblement en partie ventrale. Par contre dans les noyaux c'est I'inverse, la proteine 
Dorsal est concentree dans les noyaux de la partie ventrale et faiblement representee 
dans ceux de la partie dorsale. Les deux sites regulateurs en 5' du gene twist ont une 
faible affinite pour Dorsal et ne sont occupes que pour les fortes concentrations de 
Dorsal dans les noyaux de la partie ventrale. Un seul des sites en « cluster » 5'du gene 
rhomboid possede une haute affinite pour Dorsal de sorte que ce gene n'est stimule 
que dans les parties ventrale et laterale de I'embryon ou la proteine Dorsal est assez 
bien representee dans les noyaux. Les quatre sites introniques a haute affinite du gene 
sog peuvent lier la proteine Dorsal a toutes les concentrations nucleates, ce qui a pour 
consequence que ce gene est stimule dans toutes les regions laterales de I'embryon 
ou Dorsal est presente. 
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diffusent entre les noyaux et agissent comme des morphogenes, en 
produisant des gradients de concentration, sans le secours de voies de 
signalisation specialises qui sont habituellement necessaires pour 
obtenir ce type d’effet. Dans ce dernier cas, les proteines s’attachent aux 
domaines extracellulaires des recepteurs transmembranaires et trans- 
feree, par un signal approprie, la concentration du morphogene au noyau 
(Fig. 7.4 et Fig. 7.5). 

Un ben direct s’etablit alors avec les facteurs de transcription qui 
controlent 1’ expression des genes. Les morphogenes secretes engendrent 
des gradients de concentration auxquels repondent les genes cibles 



Figure 7.6 Exemple du controle de I'expression du gene eve participant a la 
segmentation du corps de I'embryon de drosophile. 

La sequence codante de eve est assez courte, mais le gene lui-meme possede des 
regions regulatrices de grande dimension (12 kpb), composees de sites localises a la 
fois en 5' et en 3' de la region codante. La region 5' possede deux stimulateurs 
(« enhancers*), d'une taille de 500 pb chacun, qui controlent I'expression du gene 
dans differents groupes de cellules disposees en forme de bandes (les bandes 2, 3 et 7) 
a la surface de I'embryon. La region regulatrice en 3' possede trois stimulateurs qui 
controlent I'expression du gene eve dans les bandes de cellules 1 , 4 et 6. Au total, les 
cinq stimulateurs produisent sept bandes depression cellulaire du gene eve qui avec 
d'autres genes contribuent a la formation des sept parties segmentees du corps de 
I'embryon de drosophile. 
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selon le niveau de concentration auxquels ils sont sensibles. Le processus 
depend du controle opere par les motifs ADN regulateurs qui sont 
disposes generalement en amont 5’ (parfois en 3’ egalement) des genes 
cibles et qui fixent avec des degres d’affinite variable les facteurs de 
transcription regulateurs. Ces mecanismes generaux aboutissent a la 
differentiation de territoires cellulaires distincts (Fig. 7.6). Ces demiers 
sont eux-memes a I'origine des tissus, organes et membres du futur 
organisme adulte. Cependant, de nombreux mecanismes additionnels 
restent encore a decouvrir dans le vaste champ de la biologie et de la 
genetique du developpement. 

7.4 D'OU VIENT LA NOUVEAUTE 

EN MATIERE DE DEVELOPPEMENT ? 

Parmi toutes les donnees relatives a la genetique du developpement, 
Pune des plus surprenantes se rapporte a la diversite phenotypique 
(morphologique) des organismes appartenant a de nombreux phyllums, 
diversite qui ne se reflete pas exactement dans la diversite de sequences 
geniques qui restent tres souvent, malgre les distances phylogenetiques, 
etroitement apparentees, y compris pour des genes qui ne sont pas 
directement lies au developpement. Des la formation des premiers 
genomes dans un monde ARN (voir plus haut), les mecanismes a 
I’origine des changements de sequences reposent sur des transpositions 
et des recombinaisons d’exons, realisant un veritable brassage d’un 
petit nombre de modules seulement. D’autres changements, bases sur 
des mecanismes de duplications et de mutations ponctuelles, elargissent 
le champ des possibles, mais toujours a partir d’un nombre finalement 
assez restreint de modules genetiques dont les assemblages au cours 
de revolution ressemblent a un complexe jeu de meccano. A partir de 
quelques pieces de base, des constructions aux fonctions tres diversifies 
se realisent dans une sorte de bricolage geant et patient, a l’echelle de 
millions d’annees, soumis a une selection aleatoire, et dont les traces 
sont deposees sous la forme de fossiles dans les couches geologiques. 

Entre le genome humain (environ 25 000 genes) et celui du nematode 
(19 000 genes), un petit ver rond d’un millimetre de long, compose de 
954 cellules, la genomique comparee a etabli l’existence d’homologies 
et de similitudes de sequences codantes avoisinant les 36 % ! Avec la 
souris et certains autres mammiferes, les homologies atteignent 80 %, 
et avec le chimpanze, pres de 99 %. 

D’oii provient alors la nouveaute, puisqu’elle ne se constate pas 
dans les genomes, au final si remarquablement apparentes ? 

Ne residerait-elle pas dans des changements, interessant la regulation 
de l’expression des genes et non dans les genes eux-memes ? 
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devolution de I'expression genique 

Une grande part de la biodiversite ne serait done pas la consequence 
de differences, pourtant bien reelles, presentes dans les genes homo- 
logues des diverses especes, mais plus concretement de changements 
evolutifs intervenus dans la regulation de ces memes genes. Ce type 
de changement, decouvert recemment, induit en effet de fortes conse- 
quences sur le fonctionnement des reseaux de genes (voir chapitre 5) et 
beaucoup moins dans celui des genes pris individuellement. L’exemple 
des genes HOX (voir Fig. 7.2 ) montre - au-dela de differences pheno- 
typiques entre les vertebres et les invertebres, differences liees a la 
duplication des genes et a la formation de « clusters » chez les premiers - 
que ce sont des modifications dans la regulation de leur expression, a 
la fois dans le temps et dans l’espace, qui sont les plus pertinentes 
pour comprendre revolution des mecanismes genetiques entre les orga- 
nismes consideres. Les changements intervenant dans les regulateurs 
operant en cis notamment, sont beaucoup plus pertinents, que les 
changements dans le nombre de genes ou la fonction des proteines. 
Ces changements de niveau, de profil et de rythme dans I’expression des 
genes, fournissent finalement plus d’ opportunity a la selection naturelle 
que les seules mutations dans les produits des genes eux-memes. 

La regulation en cis et en trans de I'expression genique 

La regulation en cis designe la regulation qui depend des sequences 
ADN regulatrices de I’expression d’un gene, quelles que soient leurs 
localisations. La regulation en trans designe tous les facteurs proteiques 
ou ARN qui exercent leur fonction regulatrice en se liant notamment 
aux elements de sequences en cis. 

Les changements par mutation qui ont des effets regulateurs marques 
sur I’expression genique au cours de revolution s’observent aux niveaux 
des sequences stimulatrices (enhancers), des facteurs de transcription, 
des sequences promotrices, et de divers autres elements impliques ou 
non dans la transcription. Les stimulateurs (enhancers) sont souvent 
cites comme etant les composants les plus pertinents. Une de leurs 
caracteristiques cles reside en effet dans leur aptitude a modifier de 
faqon specifique l’activite d’un ou de plusieurs genes. De plus, leur 
structure modulaire (Fig. 7.4 , 7.5 et 7.6) et la nature combinatoire de 
leur mode operatoire, sont des caracteristiques tout a fait adaptees a la 
genese de la diversite fonctionnelle. Cependant ces proprietes ne sont 
pas uniquement celles des stimulateurs. D’autres sites regulateurs, non 
transcriptionnels, presentent egalement des caracteristiques similaires. 
C’est le cas, par exemple, des sites localises dans les 3’ UTR. Ils regulent 
la traductibilite des transcrits. C’est le cas aussi des sites introniques 
et exoniques qui controlent les mecanismes d’epissage alternatif et 
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sont a l’origine de la diversite des transcrits. C’est le cas enfin des 
sites de liaisons pour les microARN regulateurs qui interviennent 
dans la stabilite des ARNm et leur traductibilite (Fig. 7.7). 

Nombreux sont les sites de regulation qui affectent les fonctions des 
genes du developpement d’une maniere independante des « enhancers ». 
Les genes sont en effet transcrits par des machineries biochimiques 
complexes dont le recrutement depend d’ interactions entre la chroma- 
tine et des elements modulaires qui controlent la transcription (enhancers 
et silencers). Ces interactions moleculaires peuvent etre modifiees par 
d’autres elements comme les isolateurs. Des elements de sequences 
au niveau des promoteurs ainsi que des facteurs additionnels specifiques 
de tissus participent au processus de demarrage de la transcription et 
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Figure 7.7 Schema recapitulate des niveaux ou s'exerce une regulation en c/s et 
en trans de I'expression genique. 
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contribuent a la cinetique de ce demarrage. Au niveau de la transcription, 
les enhancers ne sont done pas les seuls elements qui influencent ce 
processus. Mais ce n’est que le debut. Les transcrits ARN sont modifies, 
au cours de leur transcription et la nature de ces evenements (epissage, 
« capping », polyadenylation, epissage croise, etc.) a une enorme 
influence sur la qualite et la quantite des ARN messagers matures. Ces 
derniers sont par ailleurs sounds a des systemes de controle qualite/ 
degradation puis exportes du noyau selon un processus lui aussi objet 
de divers controles. Certains messages possedent des sequences parti- 
culieres qui definissent leur localisation subcellulaire ou ils seront 
finalement traduits. Les modules localises dans les UTRs affectent les 
cinetiques de traduction et la demi-vie de ces messages. Une fois la 
proteine synthetisee, d’autres processus regulateurs interviennent, 
comme la phosphorylation, la glycosylation, Lubiquitinylation et la 
sumoylation. La vitesse et le rythme de ces evenements regulateurs qui 
affectent la fonction de la proteine et sa demi-vie sont modules eux- 
memes au cours du developpement par des genes specifiques (Fig. 7.7). 

Estimation simplifiee de la taille moyenne 

des sites regulateurs mutables pour un gene standard 

A la question de savoir : quelles sont les tailles respectives des sites trans- 
criptionnels et non transcriptionnels dont les mutations peuvent avoir 
des effets sur la regulation de 1’ expression d’un gene et par voie de 
consequence imposer des changements evolutifs majeurs si la selection 
naturelle s’exerce positivement, un calcul simple permet de repondre. 

Taille moyenne des sites regulateurs transcriptionnels 

Les calculs sont bases sur l’hypothese qu’un gene possede en moyenne 
sept modules stimulateurs independants, chacun d’eux contenant dix 
sites de liaison pour des facteurs de transcription. Chaque site de liaison 
d’un facteur de transcription se compose de six paires de bases, une 
paire seulement n’etant pas specifique de la liaison. Avec ces donnees, 
le calcul donne : 

> nombre de stimulateurs : 7 ; 

> nombre de sites de liaison pour les facteurs de transcription par 
stimulateur : 10 ; 

> taille d’un site : 5 pb (6 dont 1 non specifique). 

Soit une taille totale moyenne de 350 pb (7 x 10 x 5) pour la region 
stimulatrice mutable regulant l’expression d’un gene. 

Taille moyenne des sites regulateurs non transcriptionnels 

Les calculs pour estimer les dimensions des autres sites mutables 
regulateurs de l’expression des genes sont bases sur les longueurs 
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moyennes de la sequence minimale liee par l’ARN polymerase et du 
signal consensus de polyadenylation (AATAAA), sur la longueur et le 
nombre de sites d’epissage pour un gene moyen possedant quatre 
exons et trois introns. On admet la presence de cinq stimulateurs 
d’epissage par exon avec une longueur moyenne de six nucleotides soit 
la longueur moyenne des sites de liaisons de nombreuses proteines 
liant l’ARN. La longueur moyenne des modules regulateurs de 3’ et 
5’ UTR sont conformes aux donnees de la litterature. Sur ces bases, le 
calcul donne : 

> promoteur minimal (boite TATA, initiateur, motif stimulateur de 
TARN polymerase) : 35 pb ; 

> signal de polyadenylation : 6 pb ; 

> sites accepteurs d’epissage : 3 pb x 2 = 6 pb ; 

> sites donneurs d’epissage : 3 pb x 2 = 6 pb ; 

> sites stimulateurs d’epissage : 6 pb x 20 = 120 pb ; 



Figure 7.8 a Deux scenarios montrant comment des mutations de sites regulateurs 
de I'expression de genes sont selectionnables au cours de I'evolution. 

Une premiere mutation (mutation 1) intervient dans un site exonique d'epissage en 3' 
(exon 1 du gene A). La nouvelle proteine A presente une sequence peptidique modifiee 
comparee a la proteine A de type sauvage, mais le phenotype qu'elle influence s'en 
trouve favorise par la selection naturelle. Pourtant le niveau depression de la nouvelle 
proteine n'est pas optimal et une pression de selection s'exercera pour qu'une deuxieme 
mutation au temps t 2 se produise dans un autre site regulateur ou dans un facteur 
proteique, transcriptionnel ou non. Ici, I'exemple retenu est celui d'une mutation 2 dans 
un site regulateur transcriptionnel en c/s dont la consequence sera de stimuler la trans- 
cription du gene A mute au temps t v 
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Figure 7.8 b Deux scenarios montrant comment des mutations de sites regulateurs 
de I'expression de genes sont selectionnables au cours de I'evolution. 

Une premiere mutation (mutation 1) intervient au temps t, dans un facteur agissant en 
trans. Cela peut etre un facteur de transcription comme retenu ici, mais aussi un facteur 
agissant par exemple sur la stability du messager du gene 2, avec pour consequence 
d'exercer un effet legerement negatif sur le gene 1 , et au contraire un effet legerement 
positif sur le gene 2, pas completement decisif cependant en terme d'avantage selectif. 
Une deuxieme mutation (mutation 2) au temps t 2 dans un site regulateur stimulateur de 
la transcription du gene 2 contribuera a rendre optimal le niveau de transcription de ce 
gene et I'avantage selectif qui I'accompagne.On observera ici que les deux mutations ne 
sont probablement pas liees. La premiere mutation peut done etre perdue lors d'un evene- 
ment de recombinaison ou par segregation, ce qui eliminera son effet negatif sur le gene 1 . 


> modules regulateurs en 5’ (IRES) : 30 pb ; 

> modules regulateurs en 3’ (HSP 83, [3-aeti ne) = 247 pb. 

Soit une taille moyenne totale de 450 pb (35 + 18 + 120 + 30 + 247) pour 
les sites mutables non transcriptionnels regulant I’expression d’un gene. 

Ces estimations montrent que les tallies respectives des sites regu- 
lateurs mutables sont comparables qu’ils soient transcriptionnels ou 
non transcriptionnels. Elies montrent finalement que, comparativement 
aux sequences codantes, l’impact des mutations des sites regulateurs 
de I’expression des genes peut jouer un role majeur dans les chan- 
gements evolutifs a l’origine de la biodiversite des processus develop- 
pementaux (Fig. 7.8). On notera que les signaux de phosphorylation, 
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d’ubiquitinylation et de sumoylation, de retention nucleaire, d’adressage 
aux organites, les signaux peptidiques et autres signaux regulateurs 
n’ont pas ete pris en compte. 

Modifications epigenetiques de I'expression genique 

Les modifications epigenetiques de la regulation de I’expression des 
genes et de la formation des phenotypes accompagnees secondairement 
par des mutations geniques constituent une autre classe de mecanismes 
generateurs de nouveautes evolutives en matiere de developpement 
(voir chapitre 5, et aussi le Mini Manuel de Biologie moleculaire). 
Certains biologistes considered qu’en favorisant 1’ explosion des formes 
et des plans d’ organisation caracteristiques d’une macroevolution 
intense, ce type de changements a pu jouer un role majeur au debut de 
l’histoire evolutive des organismes multicellulaires. 



POINTS CLEFS 


>- devolution s'appuie sur le constat que les seuls individus qui survived (qui 
sont selectionnes) sont ceux qui, dans un environnement changeant, sont 
les plus aptes a se reproduire parce qu'ils y sont les mieux adaptes. L'environ- 
nement exerce done un tri, une selection qui provoque une evolution en 
faisant apparaitre des adaptations. 

>- On designe par le terme de macroevolution celle qui intervient au niveau 
de I'espece ou a un niveau superieur.Typiquement la macroevolution fait 
reference aux changements qui modified I'embryogenese, les plans d'orga- 
nisation, les principales caracteristiques des individus et qui sont a la base 
de la phylogenie des grands groupes du monde vivant. La microevolution 
par contre designe au sein d'une population des changements evolutifs de 
moindre ampleur comme ceux qui sont relatifs a la frequence des alleles. 

>- Les biologistes considered que macroevolution et microevolution sont liees 
par le fait que I'accumulation graduelle de petits changements entraine les 
changements de plus grande ampleur, meme si des sauts evolutifs rapides 
sont egalement visibles dans les traces paleontologiques. 

>- devolution du developpement biologique, ou en abrege I'evo-devo, se 
propose de comparer les processus developpementaux des organismes 
vivants (animaux et des plantes). Elle essaie de determiner les relations 
ancestrales qui existent entre les organismes et comment ces processus 
ont evolue. 
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>- L'evo-devo aborde I'origine et 1'evolution du developpement embryonnaire. 
Elle analyse comment les changements dans le developpement et les 
processus qui le dirigent ont produit de nouvelles caracteristiques biolo- 
giques. Elle s'interesse au role de la plasticite developpementale dans 
1'evolution et comment I'ecologie intervient dans ces phenomenes. 

>- Le monde ARN est une hypothese resultant de I'idee que I'evenement le 
plus critique se rapportant a I'origine de la vie repose sur I'emergence 
d'une molecule autoreplicative, une molecule qui puisse a la fois se copier 
elle-meme et muter c'est-a-dire evoluer pour accroitre I'effkacite de sa 
propre replication, devolution fonctionne en effet sur la base de la variation 
et de la selection et cette derniere se mesure toujours sous le sceau de la 
multiplication la plus efficace, la capacite a faire la meilleure entite en 
question possible. 

>- Tous les animaux debutent leur vie sous la forme d'une cellule unique, et 
pour cette raison, I'embryon s'auto-organise au cours du developpement 
pour donner naissance aux nombreux types cellulaires differents, trouves 
chez I'adulte. L'auto-organisation implique une serie d'interactions geniques 
qui assemblent les cellules d'une maniere qui prefigure le plan du corps 
adulte. Des evenements de remodelage redistribuent les cellules en tissus 
specifiques, et I'expression de batteries de genes indispensables aux fonc- 
tions cellulaires specialises dirige ensuite les processus de differenciation. 

>- Le fagonnage embryonnaire et la differenciation finale sont integres par 
de vastes reseaux de regulation genique qui controlent par exemple les 
divisions asymetriques ou la signalisation entre cellules, grace a des com- 
binaisons de facteurs de transcription qui stimulent ou repriment leurs 
genes cibles en se liant aux sequences c/s-regulatrices. Si les genes cibles 
codent eux-memes des facteurs de transcription, ils controleront alors 
d'autres genes cibles si bien que le developpement peut se comparer a 
un vaste reseau transcriptionnel ou I'information c/s-regulatrice serait la 
composantecle. 

>- Les changements par mutation ont des effets marques sur I'expression 
des genes au cours de 1'evolution. Ils s'observent a plusieurs niveaux: 
sequences stimulatrices (enhancers), facteurs de transcription, sequences 
promotrices, et divers autres elements impliques ou non dans la trans- 
cription. Les modifications epigenetiques de la regulation de I'expression 
des genes et de la formation des phenotypes constituent une autre classe 
de mecanismes generateurs de nouveautes evolutives en matiere de 
developpement. 
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QCM - QROC 

7.1 Le terme « evolution » signifie-t-il progres et amelioration ? 
Expliquer. 

7.2 Qu’est-ce que l’evo-devo ? 

7.3 Citer quatre mecanismes qui contribuent a 1’evolution des genes. 

7.4 Qu’est-ce qu’un morphogene ? 

7.5 Dans l’embryon de Drosophile, des sequences situees dans les 
3’ UTR sont responsables de la localisation des ARNm des genes 
bicoid et oskar respectivement aux poles anterieur et posterieur de 
l’embryon. Quel phenotype peut-on s’attendre a observer si a la suite 
de diverses constructions et operations de transferts moleculaires, les 
regions 3’ UTR sont echangees et qu'une femelle homozygote pour 
les deux genes mutants est obtenue ? 

7.6 Plusieurs genes, dits a effets maternels, interviennent dans la 
formation des axes de symetrie antero-posterieure et dorso-ventrale. Des 
femelles mutantes homozygotes pour certains de ces genes produisent 
des embryons avec des defauts de segmentation quel que soit le geno- 
type des derniers, mutant heterozygote ou homozygote (exemple du 
gene bicoid : bcd+/bcd ou bcd/bcd). Pour d’autres genes mutes, a effets 
maternels, la production d’un phenotype mutant peut etre evitee si un 
allele sauvage du gene considere est apporte par le pere. Comment 
peut-on expliquer la difference exercee sur le phenotype selon l’une 
ou P autre des categories de genes a effets maternels. 

7.7 Les supports physiques des mecanismes regulateurs intervenant 
dans les relations de type « hierarchie de genes » et « reseaux de 
genes » sont-ils differents ? Expliquer. 

7.8 Donner un exemple de site regulateur transcriptionnel et non 
transcriptionnel. 


REPONSES 


7.1 Non. Les notions de superiority d’un genotype, d’un phenotype 
ou d’un organisme sur un autre sont etrangeres a la theorie de revolu- 
tion. Evolution ne signifie pas amelioration. Les notions cles sont les 
notions de variation, d’ adaptation et de selection au hasard. 
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7.2 L’evo-devo essaie de determiner les relations ancestrales qui 
existent entre les organismes et de quelle maniere ces processus ont 
evolue. L’evo-devo aborde l’origine et 1’ evolution du developpement 
embryonnaire. Elle analyse de quelle maniere les changements dans 
le developpement et les processus qui le dirigent ont produit de 
nouvelles caracteristiques biologiques. Elle s’interesse au role de la 
plasticite developpementale dans revolution et de quelle facjon l’ecologie 
(l’environnement) intervient dans ces phenomenes. 

7.3 La mutation, le brassage, la transposition et la duplication. 

7.4 Un morphogene est une biomolecule qui intervient directement 
par son activite, souvent exprimee sous la forme d’un gradient spatio- 
temporel, dans la morphogenese d’un organisme. 

7.5 Une inversion de l’axe antero-posterieur. 

7.6 Les genes dits a effet maternels sont localises dans les cellules 
nourricieres de l’embryon et non dans l’embryon lui-meme qui ne 
recoit que les ARNm ou les proteines corxespondantes. Si le gene est 
mute, l’ARNm ne sera pas fonctionnel par defaut de localisation 
(voir 7.5) ou par inactivity de la proteine correspondante. La presence 
d’un gene nucleaire sauvage homologue, apporte par le pere evitera le 
phenotype mutant resultant pourvu que 1’ expression de ce gene s’effectue 
correctement a la fois dans l’espace (localisation du transcrit ou de la 
proteine dans la partie attendue de l’embryon) et dans le temps 
(expression au moment adequat de l’embryogenese). Les phenotypes 
lies aux genes a effets maternels mutes qui n’ont pas d'homologue 
nucleaire fonctionnel ne seront pas evites. 

7.7 Non. Dans la majorite des cas, le fonctionnement des cascades 
regulatrices ou des reseaux regulateurs repose sur des elements cis- 
(motifs de sequences ADN) et trans-regulateurs (facteurs proteiques 
et ARN regulateurs) communs ou similaires. Les differences sont dans 
les modalites de mise en oeuvre (existence ou non de gradients, nombre 
de sites c A- regulateurs, affinite differentielle des sites, et surtout inter- 
actions croisees ou non des elements cis et t/rms-regulateurs). 

7.8 Les sites regulateurs transcriptionnels du gene eve et les sites 
regulateurs en 3’ UTR des transcrits de bicoid. 
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des populations 

8.1 Calculs des frequences genotypiques et alleliques 

8.2 Le modele de Hardy-Weinberg 

8.3 Applications aux alleles rares 

8.4 Parente et coefficient de consanguinite 

8.5 Moderation de la selection naturelle 

> Aborder les premiers elements de genetique des populations 

> Aborder les calculs de frequences alleliques et genotypiques 

> Aborder les bases du modele de Hardy-Weinberg 


En publiant en 1859 De Uorigine des especes, Darwin exposait une 
theorie de 1’ evolution des especes par selection naturelle qui peut se 
resumer en trois principes : 

> le principe de variation : dans une population, il existe une variation 
entre individus et elle concerne leur morphologie, leur physiologie 
et leur comportement ; 

> le principe de l’heredite : les jeunes ressemblent plus a leurs 
geniteurs qu’a des individus auxquels ils ne sont pas apparentes ; 

> le principe de selection : certains individus sont plus aptes a survivre 
et a se reproduire dans un environnement donne. 

11 en ressort que les populations naturelles se composent d’individus 
genetiquement differents pour un grand nombre de genes et qu'il existe 
un polymorphisme genetique des populations. Confrontees aux modi- 
fications des facteurs environnementaux, ce polymorphisme constitue 
pour les especes un veritable capital adaptatif permettant leur survie. 

La genetique des populations s’efforce d’evaluer la diversite genetique 
et d’etablir des lois decrivant dans le temps et l’espace le maintien ou 
la modulation de la variation genetique au sein d’une population. Son 
point de depart est la recherche des differents alleles d’un gene dans 
une population concernee et l’analyse des frequences de ceux-ci. 
Pour un grand nombre de genes, 1’ analyse du polymorphisme donnera 
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une estimation de la diversite genetique globale rencontree entre des 
individus d’une meme population mais aussi entre des populations 
( Tableau 8.1). Cependant, les modeles theoriques de la genetique des 
populations (les lois) ne s’appliquent correctement aux mecanismes 
responsables de la diversite genetique que pour un voire deux genes, 
rarement plus. 


Tableau 8.1 Frequences des groupes sanguins MN dans diverses populations. 


Populations 

Frequences phenotypiques 
(ou genotypiques*) 

Frequences 
des alleles 

It/I/M 

M/N 

N/N 

p(M) 

q (N) 

Indiensamericains 

0,60 

0,35 

0,05 

0,78 

0,22 

Blancs americains 

0,29 

0,50 

0,21 

0,54 

0,46 

Noirs americains 

0,28 

0,50 

0,22 

0,53 

0,47 

Esquimaux 

0,83 

0,16 

0,01 

0,91 

0,09 

Allemands 

0,30 

0,50 

0,20 

0,55 

0,45 

Chinois 

0,33 

0,49 

0,18 

0,57 

0,43 

Nigeriens 

0,30 

0,50 

0,20 

0,55 

0,45 


* Frequences phenotypiques et frequences genotypiques sont ici identiques parce qu'a chacun des 
genotypes correspond un phenotype parfaitement identifiable. 


Le systeme de groupe sanguin MN resulte de variations ponctuelles dans la sequence 
en acides amines de la partie N-terminale de la glycophorine A, proteine presente a la 
surface des erythrocytes. Les phenotypes sont mis en evidence a I'aide d'anticorps diri- 
ges contre le produit de I'un ou I'autre des deux alleles. L'antigenicite est determinee 
par le polymorphisme des acides amines 1 et 5. Pour I'allele M la sequence N-terminale 
de la glycoproteine est : Ser-Ser-Thr-Thr-Gly-Val-etc., et pour I'allele N : Leu-Ser-Thr- 
Thr-Glu-Val-etc. Pour une population donnee, la somme des frequences (phenotypi- 
ques ou alleliques) est bien evidemment egale a 1 . 


8.1 CALCULS DES FREQUENCES GENOTYPIQUES ET ALLELIQUES 

Pour un locus donne, la genetique des populations cherche a comprendre 
la relation entre deux variables etroitement liees : la frequence geno- 
typique et la frequence allelique ou genique. 

f (A) se dit frequence de I’allele A ou frequence allelique ; f (G)x se dit 
frequence genotypique pour x qui represente ici la combinaison des 
alleles A/A. 
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Les frequences genotypiques se calculent par le comptage des indi- 
vidus porteurs des differents genotypes possibles (voir par exemple 
Tableau 8.1). Ainsi, pour un locus ou deux alleles A et A’sont identifies, 
on pourra denombrer les individus diploides porteurs de l’un des trois 
genotypes A/A, A/A’etA’/A’. Les frequences genotypiques attribuables 
a chaque groupe d’ individus seront par exemple f (G)x , f (G)y et / (G)Z 
respectivement. Generalement, ces frequences sont exprimees soit en 
pourcentage, leur somme etant alors egale a 100 ; soit en proportion, 
la somme egalant alors 1 . 

Connaissant les frequences genotypiques on peut calculer les 
frequences alleliques. Exemple : Pour calculer la frequence de P allele A, 
on doit s’appuyer sur les frequences genotypiques des individus porteurs 
de L allele A. Or la frequence de L allele A correspond a la probabilite de 
trouver P allele A chez un individu pris au hasard dans la population 
consideree. 

Pour determiner une frequence genotypique, on considere ici qu’a 
chacun des genotypes homozygotes (A/A et A ’/A’) ainsi qu’au geno- 
type heterozygote (A/A’) correspond un phenotype parfaitement 
identifiable. 

Si l’individu examine possede un genotype homozygote A/A, la 
probabilite de trouver P allele A sera done maximale et egale a 1. 
Evidemment, cela n’est vrai que pour ce type d’individus. Aussi, faut-il 
tenir compte de leur representation dans la population, autrement dit 
de la frequence x du genotype dans la population, soit / (G)X . Pour cette 
partie de la population, on dira que la frequence allelique /(A) est 
egale a 1 x f (G)x . 

Si l’individu examine possede un genotype A/A’, la probabilite de 
trouver P allele A sera evidemment de 1 sur 2, soit 0,5, qu’il faudra 
corriger par la frequence f (G)y correspondant aux individus de geno- 
type A/A ’dans la population. Pour cette partie de la population, on dira 

f 

que la frequence allelique f (Aj est de 0,5 x / (G)y ou .A— . 

Enfin, si l’individu examine possede un genotype A ’/A’, la probabilite 
de trouver A sera nulle, corrigee en theorie par la frequence f (G)z des 
individus de genotype A ’/A’, soit une frequence de P allele A pour 
cette partie de la population egale a f (A) = 0 x / (G)Z . 

Pour l’ensemble de la population, la frequence f (A) ou p sera egale 
a la somme des frequences partielles, soit : 

f (A) = (1 X /(G) x) + (0,5 X f m ) + (0 X / {G)Z ) = / (G)X + f ^I = p ; 


8.2 • Le modele de Hardy-Weinberg 
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Un raisonnement similaire amene pour la frequence / (A) ou q de 
1’ allele A’a: 

f(A') = (0 x / (G)x ) + (0,5 x / (G)y ) + (1 X/ (G)Z )= f jm +/ (G)z =q; 

la somme des frequences / (A) et / (A) etant bien evidemment egale a 1, 
d’ou : 

f(A) + f (A ’) = p + q = 1. 

8.2 LE MODELE DE HARDY-WEINBERG 

Dans une population d’individus diplo'ides, differents genotypes 
peuvent coexister, c’est le polymorphisme genetique. Pour un gene 
donne, les frequences de ces genotypes / (G) evoluent au til des gene- 
rations. Quand on peut les etablir a une generation donnee, est-il 
possible de les connaitre a la generation suivante ? C’est a cette question 
que s’efforce de repondre le modele mathematique ou loi de Hardy- 
Weinberg. 

Conditions requises pour I'application du modele 

Le modele ou loi de Hardy-Weinberg s’ applique a une population 
theorique formant une communaute d’individus qui ne se perpetuent 
entre eux que par la reproduction sexuee. 

La loi theorique est etablie dans le cas le plus simple en considerant 
un gene autosomique n’ayant que deux alleles possibles. Ceci exclut 
l’existence de toute mutation qui ne ferait qu’accroitre le nombre des 
alleles. De plus (Fig. 8.1) nous devons considerer que : 

> la formation des couples reproducteurs (1) s’opere au hasard, c’est- 
a-dire independamment des liens de parente et des genotypes. Ces 
couples sont dits panmictiques (on parle egalement de conditions 
de panmixie). II n’y a pas de selection au niveau des reproducteurs. 

> les deux types de gametes quel que soit leur genotype (leur allele 
respectif) ont la meme possibilite de participer a la fecondation (2). 

> les zygotes (3), quelle que soit la combinaison allelique (genotype) 
parmi les trois possibles, sont supposes avoir la meme probabilite 
de donner un individu (4). Pour le gene considere, aucun des trois 
genotypes n’influence l’esperance de vie (5) et tous les individus 
adultes a la generation suivante (n + 1) peuvent se reproduire. 

> enfin, la taille de la population doit etre suffisamment grande pour 
negliger les fluctuations aleatoires de la frequence des alleles. 
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Frequences genotypiques 
des adultes 


Frequences des divers 
assortiments de genotypes 
(d'alleles) a la meiose 


Frequences genotypiques 
a la naissance 


Figure 8.1 Modele general, applique en genetique des populations, entre les 
stades adultes reproducteurs de deux generations successives. 

Les chiffres entre parentheses indiquent les points critiques restrictifs qui sont detailles 
dans le texte. 


Generalisation du modele de Hardy-Weinberg 

On considere une population constitute d’ adultes reproducteurs, a la 
generation n. Pour un gene autosomique diallelique (allele A et allele A’) 
trois genotypes possibles sont detectables : A/A, A/A’ouA’/A etA’/A’ 
avec des frequences respectives / (G)X , / (G)y et / ( G ) Z - Si la frequence de 
L allele A, f (A) ou p, est identique dans les deux types de gametes 
(spermatozoides et ovocytes), il en est de meme pour celle de P allele A’, 
f (/V) ou q, la somme des fequences des deux types gametiques (p + q) 
sera egale a 1 . Les unions au hasard des gametes lors de la feconda- 
tion dans une telle population panmictique (voir plus haut) peuvent se 
representer comme dans la figure 8.2. 

La probability que le gamete male (spermatozoide) et le gamete 
femelle (ovocyte) soient tous deux porteurs de V allele A sera egale au 
produit (p x p) des frequences alleliques, soit p 2 . Cette valeur definit 
egalement la frequence genotypique / (G) x des homozygotes A/A a la 
generation suivante (n + 1). De meme, la frequence / (G)z des homo- 
zygotes A ’/A ’ sera q x q = q 2 et celle des heterozygotes A/A ’(geno- 
types A ’/A et A/A ’) f (G)y sera (p x q) + (q x p) = 2 pq. 



8.2 • Le modele de Hardy-Weinberg 
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Spermatozoi'des 



A ( p) 

A'(q) 

A 

A/A 

A /A' 

(P) 

(P 2 ) 

(p q) 

A' 

A' /A 

A' /A' 

(q) 

(q p) 

(q 2 ) 


Figure 8.2 Union au hasard des gametes lors de la fecondation dans une 
population panmictique. 


Ainsi, a la generation (n + 1), apres un croisement au hasard, les 
trois genotypes A/A, A/A’ , A’ /A’ se repartissent respectivement selon 
les frequences genotypiques / (G)x = p 2 , / (G)y = 2 pq, / (G)z = q 2 . 

Si on applique la formule generale de calcul des frequences alleliques 
a partir des frequences genotypiques, presentee plus haut, on obtient a 
la generation (n + 1 ) pour : 

> la frequence de 1’ allele A : 

/(A)= /(G)x+ = P 2 + ^ = P (p + q) 

> la frequence de 1’ allele A’: 

/(A')= /(G)z + = q 2 + = q (p + q) 

Or comme p + q = 1, on retrouve pour les deux alleles A et A’ les 
frequences p et q identiques a celles etablies a la generation precedente n. 
Cette stabilite de la frequence des alleles est appelee « equilibre de 
Hardy-Weinberg ». Elle requiert pour etre maintenue indefiniment les 
conditions suivantes : une population panmictique, de taille infinie, 
sans mutation pour les alleles consideres, et dans laquelle ne s’exerce 
aucune selection. Un dernier critere pour le maintien de 1’ equilibre est 
T absence de migration. 

Si les frequences alleliques / (A) = p et f ( V) = q demeurent stables, 
les frequences genotypiques / (G)X , / (G)y et / (G)z qui avaient a la genera- 
tion n des valeurs quelconques, deteiminees experimentalement, sont 
devenues a la generation (n + 1 ) respectivement p 2 , 2 pq et q 2 (voir 
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plus haut). Elies demeureront inchangees tant que les frequences 
alleliques p et q ne seront pas soumises a des variations. Cet etat 
d’equilibre entre les frequences alleliques et genotypiques d'un gene 
autosomique est atteint, dans ces conditions restrictives un peu 
theoriques, en une seule generation. 

Mise en evidence de la relation entre equilibre allelique 
et equilibre genotypique 

Considerons deux populations PI et P2 ou ne sont represents que les 
2 alleles A et A’. Ces deux populations seront caracterisees a titre 
d’exemple, par les frequences genotypiques suivantes ( Tableau 8.2). 


Tableau 8.2 Frequence genotypiques de deux populations PI et P2. 


Genotype 

A/A 

A/A' 

A'/A' 

Frequence 

■f(G)x 

f ( G)y 

f ( G)z 

PI 

0,3 

0,2 

0,5 

P2 

0,1 

0,6 

0,3 


Les frequences parentales des alleles A et A ’dans ces deux populations 
s’averent identiques et egales a 0,4 et 0,6 respectivement : 

> Population 1 : 

/(A, = /(G ) x+ / -f- y =0,3+ ^=0,4 

et f (A 1 ) =/( G)z + = 0,5 + 9£ = 0,6 

>• Population 2 : 

/ ( A) = /(G)x+ / -f- y = 0,1 + ^=0,4 

et f(A-) = f(G)z + = 0,3 +^=0,6 

Ainsi, bien que les frequences genotypiques different (voir tableau), 
ces deux populations possedent les memes frequences alleliques : p = 0,4 
et q = 0,6. Apres une generation de panmixie, soit a (n + 1) les deux 
populations possederont cependant les memes frequences genotypiques : 
/ (G )x=P 2 = (0,4) 2 = 0,16 
/( G)y = 2 pq = 2 (0,4 X 0,6) = 0,48 
/( G) z = q 2 = (0,6) 2 = 0,36 

qui se maintiendront tant que p et q resteront constants. 


8.3 • Applications aux alleles rares 
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8.3 APPLICATIONS AUX ALLELES RARES 

Jusqu’ici nous avons considere qu’il etait possible de determiner les 
frequences genotypiques d’apres L observation du phenotype des 
individus. Ceci signifie que la combinaison des deux alleles du gene 
considere present chez 1’ heterozygote donne un phenotype aisement 
identifiable distinct des phenotypes des deux homozygotes. Nous 
avons done fait abstraction des caracteres dominants ou recessifs qui 
rendent impossible le calcul des frequences alleliques car, par 
exemple pour les deux genotypes (A/A et A/a) nous observerions un 
phenotype identique lie au caractere dominant (A). Le modele de 
Hardy-Weinberg permet cependant d’ avoir acces indirectement aux 
frequences alleliques si la population obeit bien a Lequilibre prece- 
demment decrit. Dans ces conditions, les frequences genotypiques / (G)x , 
/ (G ) y et f (G)z pour lesquelles on ne peut estimer, par l’observation des 
deux phenotypes, que les valeurs |/ (G)x +/ (G)y ] et/ (G)z , se presentent a la 
generation (n + 1 ) comme suit ( Tableau 8.3) : 


Tableau 8.3 



Phenotype dominant 

Phenotype recessif 

Genotype 

A/A 

A/a 

a/a 

Frequence genotypique 

h G)x= P 2 

f(G)y = 2pq 

L(G) z = P 2 


Le phenotype recessif ne peut provenir que d’ individus homo- 
zygotes portant les deux alleles a. La frequence d’apparition de tels 
individus (q 2 ) dans une population est quantifiable par simple comptage. 

On en deduit la frequence allelique de L allele a, f (aj = Jq " , sachant 
que p + q = 1, on en deduit indirectement / (A) = p = 1 - q. A partir de 
la connaissance d’une des frequences alleliques (q), il s’avere done 
possible de representer la relation generale entre les frequences des 
differents genotypes, homozygotes et heterozygotes (Fig. 8.3). Dans 
une population panmictique, on observe qu’un allele rare, e’est-a-dire 
dont la frequence est proche de 0, ne se maintiendra que grace a sa 
presence chez les individus heterozygotes. Cette observation possede 
un grand interet dans le cas de maladies genetiques recessives pour 
determiner dans une population le nombre de porteurs sains presents 
(voir chapitre 1). 
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Figure 8.3 Representation des frequences genotypiques observables dans une 
population a I'equilibre en fonction de la frequence allelique (q) de I'allele recessif a. 


Pour reprendre deux exemples deja decrits, l’albinisme et la phenyl- 
cetonurie, on observe les frequences suivantes dans la population 
framjaise ( Tableau 8.4) : 


Tableau 8.4 



Frequence 
de la maladie 
a la naissance* 

Frequence 
allelique Jq* 

Frequence 
des porteurs sains 

2 pq ou2q(1 -q) 

Albinisme 

1/10 000 

1/100 

1,98/100 

Phenylcetonurie 

1/16000 

0,8/100 

1,59/100 


* Frequence du phenotype ou genotype recessif q 2 


Le rapport individus porteurs sains/individus malades est egal a : 

les soit on 

q 2 q 2 q 

11 montre que plus un allele est rare dans une population, plus la propor- 
tion d' heterozygotes (porteurs sains) est superieure a celle des homo- 
zygotes (malades). Dans Fexemple ci-dessus, ce rapport est egal a 198 
dans le cas de I' al bin is me (frequence allelique 1/100) et 254,4 pour la 
phenylcetonurie (frequence allelique 0,8/100). Autrement dit, plus ce 
rapport est eleve, plus la frequence de la mutation au locus respon- 
sable de la maladie est rare. 
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La meme demarche peut etre suivie pour les mutations responsables 
de maladies genetiques dominantes. Dans ce cas, la frequence F 
des individus malades inclut les heterozygotes et F a comme valeur : 

p 2 + 2 pq. La frequence de 1’ allele sain est q = J \ - F et celle de V allele 
mute, vecteur de la maladie, p = 1 - J 1 - F. 

Ces calculs supposent une absence de selection ou d’ interventions 
exterieures comme c’est le cas chez Lhomme en raison des progres de 
la medecine. 11 n’en demeure pas moins que la loi d’equilibre de 
Hardy- Weinberg reste un modele central a partir duquel il devient 
possible de suivre revolution d’une population (limite et vitesse des 
modifications) lorsque les conditions d’equilibre ne seront plus 
respectees. On peut voir ci-dessous le role de la consanguinite dans ce 
phenomene. 

8.4 PARENTE ET COEFFICIENT DE CONSANGUINITE 

Dans les populations naturelles, les accouplements aleatoires sont en 
general la regie, et la distribution des alleles a un locus donne reflete 
cette situation. Mais le phenomene n’est pas universel et les ecarts a la 
panmixie peuvent par exemple provenir d' unions preferentielles entre 
individus apparentes. On parle d’endogamie ou consanguinite. En 
genetique, est dit consanguin le fils (la fille) issu(e) de L union de deux 
individus genetiquement apparentes, c’est-a-dire ayant au moins un 
ancetre commun. 

Les termes : pere, mere, fils, fille, etc., s’appliquent egalement en 
genetique animale pour designer l’appartenance des animaux a telle 
ou telle generation. 

Dans les populations naturelles, l’endogamie peut etre la conse- 
quence d’un confinement geographique, de certains mecanismes de 
reproductions ou de caracteristiques de comportement. Dans les popu- 
lations fortement selectionnees, Lendogamie est un risque permanent. 
C’est le cas dans les elevages d’animaux de ferme, et le selectionneur 
doit veiller constamment a dejouer les consequences nefastes des 
accouplements entre individus apparentes. Bien que chez l’homme la 
consanguinite soit un tabou social, les unions entre individus sembla- 
bles (homogamie) pour certains caracteres (taille, couleur de la peau, 
etc.) sont communes. Une difference doit etre faite cependant entre 
l’homogamie qui ne conceme qu'un caractere particulier, meme si 
quelques genes sont impliques, et l’endogamie qui concerne la totalite 
du genome. 

Le degre de consanguinite peut s’exprimer par le coefficient de 
parente (r). 11 nranifeste la probabilite qu’un ancetre ait transnris a ses 
deux descendants directs le meme allele parmi les deux distincts qu’il 
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possede a un locus donne. Pour un frere et une soeur, il sera de 0,5. 
Cette valeur represente la proportion de genome identique chez deux 
individus apparentes, consequence de leur ascendance commune. 
C’est pourquoi, ensuite l’accouplement de deux individus apparentes 
accroit la probabilite qu’un allele provenant d’un ancetre commun 
soit present chez les descendants ou il s’exprimera sous la forme 
homozygote. Ainsi, la consanguinite n’augmente pas la frequence des 
mutations, mais elle permet en revanche une augmentation de la 
proportion des individus homozygotes. La probabilite d'homozygotie 
par filiation est appelee coefficient de consanguinite (F). 




Figure 8.4 Le coefficient de consanguinite : probabilite d'homozygotie par filiation. 

La figure 8.4 materialise cette probabilite. Elle est de 0,5 pour que 
chaque individu (III et IV) reyoive L allele A1 de leur pere (I). De 
meme, elle est de 0,5 pour que cet allele A1 soit transmis a leur propre 
descendant (V) consanguin, soit une probabilite de 0,25. Cette valeur 
exprime egalement la probabilite que V soit homozygote par filiation. 
Une consanguinite aussi forte peut avoir des consequences desavanta- 
geuses lorsque L allele est rare et qu’a l’etat homozygote il provoque 
une maladie. Si sa frequence p est de 1/1000, la frequence d’ apparition 
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d’homozygotes de 1’ allele defectueux Aj dans une population naturelle 
d’apres la loi de Hardy-Weinberg sera de p 2 soit 1/1000000 (voir 
exemple de la phenylcetonurie au chapitre I). Dans le cas d’un couple 
d’individus apparentes (III) et (IV) dont l’un des parents (I) ou (II) est 
heterozygote (porteur sain), le risque que ce couple ait une descen- 
dance (V) homozygote augmente. Mathematiquement la probabilite 
diminue, elle correspond a la probabilite que (I) ou (II) soit hetero- 
zygote (frequence de l’allele de 2 pq), qu’ils transmettent l’allele rare 
defectueux Aj a leurs deux descendants (III) et (IV) soit une probabilite 
de 0,5 et que (V) soit homozygote (probabilite de 0,25), ce qui donne : 

(2 pq + 2 pq) x 0,5 x 0,5 x 0,25 = B 

Comme q (frequence de 1’ allele correct) est voisine de 1, la proba- 
bilite que le descendant (V) soit malade (homozygote pour l’allele 
defectueux) sera de p/4 soit 1/4000. Si on compare la frequence d’un 
homozygote (p 2 ) dans une population naturelle panmictique, a celle 
obtenue suite a l’union consanguine entre individus directement 
apparentes (p/4), il en ressort une augmentation d’un facteur 250 soit 
(lx 10 6 )/(4 x 10 3 ) de la probabilite d’homozygotie pour l’allele defec- 
tueux, soit un risque accru identique que le descendant manifeste la 
maladie genetique. 

De maniere plus generale, dans le cas d’unions consanguines, on 
peut ecrire que la frequence d'homozygotes pour un allele quelconque 
est de : 

p/4 _ 1 
p 2 4 p 

L’homozygotie par filiation decroit en fonction du degre de parente. 

Par exemple elle est de pour des cousins au premier degre. 

16 p 

En favorisant les unions consanguines chez les animaux domestiques 
ou par autofecondation chez les vegetaux, c’est-a-dire en pratiquant 
l’endogamie systematique, l’eleveur peut, a partir d’une population 
heterozygote, en quelques generations « creer » une population homo- 
gene pour un phenotype par la fixation d’ alleles impliques dans le 
determinisme du caractere recherche. Cette demarche s’ applique en 
selection bovine ou, par exemple l’un des caracteres phenotypiques 
d’ identification d’une « race » est la couleur de la robe. 

8.5 MODELISATION DE LA SELECTION NATURELLE 

II faut se rappeler que la selection opere a partir du phenotype des 
individus. C’est parce que tel individu est plus apte a survivre et peut 
par consequent mieux se reproduire que son genotype se repandra au 
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sein de la population. Envisageons un modele dans lequel la selection 
naturelle des individus s’applique a un locus possedant deux alleles, B 
et B’. La probabilite de survie de l’individu, de la naissance jusqu’a 
l’age adulte, varie en fonction du genotype. Considerons les probability 
de survie suivantes ( Tableau 8.5) : 


Tableau 8.5 Probabilite de survie en fonction des genotypes. 


Genotypes 

Probabilite de survie 

B/B 

1 

B/B' 

1 

BUB' 

1 -s 


On appelle coefficient de selection, s, une valeur comprise entre 0 
et 1 qui traduit la difference entre la plus faible aptitude de survie des 
individus homozygotes (B7B’)’ jusqu’a l’age adulte et celle des indi- 
vidus possedant les genotypes les plus aptes ( B/B , B/B’). Par exemple, 
si s = 0,2, cela signifie que le probabilite de survie ou aptitude a la 
survie des individus de genotype B7B’ vaut 80 % de celle des individus 
B/B et B/B’. Au til des generations, il y aura une dilution de l’allele B’ 
aboutissant a son elimination. On dira alors qu'il y a fixation de 
I’allele B. En genetique des populations, on considere qu’un allele est 
fixe lorsque sa frequence est de 1, c’est-a-dire que tous les individus 
sont homozygotes pour cet allele. La vitesse de variation de la 
frequence des alleles se determine en calculant la frequence p' de B a 
une generation (n + 1) par rapport a la frequence p du meme allele a la 
generation precedente. 

Ap = p’ - p represente la variation de la frequence allelique d’une 
generation a la suivante. La selection s’opere a la generation (n + 1 ) et 
elle modifie le nombre d’adultes dans la mesure ou les individus 
homozygotes (B’/B’) adultes sont moins nombreux qu’a la naissance. 
Les nouvelles frequences genotypiques sont done a calculer de telle 
maniere que leur total demeure egal a 1. Pour cela, il faut diviser 
chaque valeur de frequence par la somme des frequences relatives 
calculees ainsi : p 2 + 2 pq + q 2 (1 - s) = 1 - sq 2 . 

A la generation (n + 1), pour les individus d’age adulte, la 
frequence allelique p’ de B sera egale a la somme de la frequence 
genotypique des individus B/B, soit p 2 , et de la moitie de celle des 
individus B/B’, soit 2 pq, 2, divisees par la somme des frequences 
relatives 1 - sq 2 , d’ou : 
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■_ P 


, p 2 + pq , , .. , 

p = \ L~! , avec p + q = 1 soit p = 

1 - sq 2 1 - sq 2 


( 1 ) 


On en deduit que 

Ap = p’-p=J£i_ (2) 

1 - sq 2 

Le coefficient de selection ayant une valeur toujours positive, 1 - sq 2 
est inferieur a 1, aussi p’ devient a la generation (n + 1) superieur a p. 
Grace a F equation (2), le calcul de la variation des frequences alleliques 
s’avere possible de generation en generation connaissant le coefficient 
de selection et les frequences alleliques de depart. Si seule, la variation 
des frequences alleliques est connue, on pourra calculer s en combinant 
les equations (1) et (2) d’oit : 


s = 


Ap 

pq 2 


Si dans le cas traite, F allele B etait un allele dominant, sa frequence 
augmenterait au fil des generations. Cependant, il faudrait un tres 


Frequences genotypiques des adultes : 

B/B , B/B', B'/B' 
p 2 + 2 pq + q 2 = 1 

panmixie 

Generation (n) 

Frequences genotypiques a la naisssance : 

B/B , B/B', B'/B' 
p 2 + 2 pq + q 2 = 1 
aptitude : 1 1 1-s 

Selection 

(survie) 

Generation (n + 1) 


Frequences relatives genotypiques des adultes: 

B/B , B/B', B'/B' 
p 2 + 2 pq + q 2 (1 - s) < 1 

Frequences genotypiques des adultes: 

B/B , B/B', B'/B' 

p 2 / (1 - sq 2 ) + 2 pq / (1 - sq 2 ) + q 2 (1 - s) / (1 - sq 2 ) 


Figure 8.5 Schema recapitulate montrant la variation des frequences genotypiques 
lors d'une selection naturelle. 
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grand nombre de generations pour eliminer completement 1’ allele B’ 
recessif. En effet, plus sa frequence devient rare plus la proportion liee 
au genotype heterozygote ( B/B ’) augmente (Fig. 8.5 et Tableau 8.6). 
Comme les phenotypes B/B et B/B’ sont identiques, la selection n’a 
aucune prise sur 1’ allele B ' contenu dans l'heterozygote ou il demeure 
« a l’abri ». 11 ne peut done pas etre totalement elimine. 

La panmixie permet uniquement la conservation de ces frequences 
entre deux generations n a l’age adulte et (n + 1) a la naissance. A la 
generation (n + 1), le coefficient de selection entraine une modification 
des frequences chez les adultes. Un exemple numerique (Tableau 8.6) 
illustre ceci avec une valeur hypothetique pour le coefficient de selec- 
tion s de 0,3 pour les homozygotes B’/B’. 


Tableau 8.6 Exemples de variations chiffrees lors d'une selection naturelle. 



Genotypes 

Total 

B/B 

B/B’ 

B’/B’ 

A la naissance : Nombre 

4 

32 

64 

100 

Frequence (%) 

0,04 

0,32 

0,64 

1 

Aptitude 

1 

1 

0,7 


A I'age adulte : Nombre 

4 

32 

45 

81 

Frequence relative 

0,04 

0,32 

0,45 

0,81 

Frequence (%)* 

0,05 

0,40 

0,55 

1 


* On constate qu'en une generation, dans la population concernee, la proportion d'individus B/B et B/B' 
a augmente en raison de la selection qui s'exerce sur les individus B'/B' entre la naissance et I'age adulte. 



POINTS CLEFS 


>- Les populations naturelles se composent d'individus genetiquement diffe- 
rents pour un grand nombre de genes et qu'il existe un polymorphisme 
genetique des populations. Confrontees aux modifications des facteurs 
environnementaux, ce polymorphisme constitue pour les especes un 
veritable capital adaptatif permettant leur survie. 

>- La genetique des populations s'efforce d'evaluer la diversity genetique et 
d'etablir des lois decrivant dans le temps et I'espace le maintien ou la 
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modulation de la variation genetique au sein d'une population. Son point 
de depart est la recherche des differents alleles d'un gene dans une 
population concernee et I'analyse des frequences de ceux-ci. 

>- Dans une population d'individus diploYdes, differents genotypes peuvent 
coexister, c'est le polymorphisme genetique. Pour un gene donne, les 
frequences de ces genotypes / (G) evoluent au fil des generations. Quand 
on peut les etablir a une generation donnee, est-il possible de les connaitre 
a la generation suivante ? C'est a cette question que s'efforce de repondre 
le modele mathematique ou loi de Hardy-Weinberg. 

>- Dans les populations naturelles, les accouplements aleatoires sont en 
general la regie, et la distribution des alleles a un locus donne reflete cette 
situation. Mais le phenomene n'est pas universel et les ecarts a la panmixie 
peuvent par exemple provenir d'unions preferentielles entre individus 
apparentes.On parle d'endogamie ou consanguinite.En genetique, est dit 
consanguin le fils (la fille) issu(e) de I'union de deux individus genetiquement 
apparentes,c'est-a-dire ayant au moins un ancetrecommun. 


QCM - QROC 

8.1 On observe que dans une population soumise au test de sensibilite 
au PTC, 70 % des individus sont sensibles. En supposant que ce pheno- 
type est lie a un allele dominant 5 et l’insensibilite au PTC a T allele 
recessif s, quelles sont les frequences des alleles et des genotypes 
dans cette population 

8.2 Dans une population le taux de mutation de G — > g est de 4 x 10 -6 . 
Si p = 0,8 peut-on predire ce qu’il sera dans 50000 generations ? 

8.3 Une population essentiellement composee d’individus fertiles de 
genotypes A/A et A/a comporte 0,1 % d’individus a/a. Quelle pression 
de selection s’exerce contre les individus de genotype a/a si le taux de 
mutation A — > a est de 10 -5 ? 


REPONSES 


8.1 Puisque 70 % des individus sont sensibles au PTC, 30 % sont 
insensibles. La frequence des homozygotes recessifs est q 2 , d’ou 

q = 7^30 = 0,55. 

Comme p + q = lona:p — l-q — l- 0,55 = 0, 45. 
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D’ou : p 2 = 0,45 2 = 0,20 (S/S) -,2pq = 0x 0,45 x 0,55 = 0,50 (S/s) 
q 2 = 0,30 (s/s) 

8.2 La frequence allelique devient de plus en plus faible au cours 
des generations. Ap egalement. Apres 50000 generations on a : 


Glossaire 


Pour se reperer plus facilement, les mots du glossaire sont en couleur 
dans le cours. 


Adduct : divers groupes chimiques reactifs d’origine environnementale, 
accoles par voie enzymatique ou chimique a 1’ ADN et provoquant des 
erreurs de replication. 

ADN polymerase : famille d’enzymes qui synthetisent de nouveaux 
brins d’ADN a partir d’une matrice modele. 

Allele : une des diverses formes d’un gene presente a un locus 

ARN non codant : designe tout ARN resultant de la transcription 
d'une sequence d’ADN jamais traduit en proteine. 

Bacteriophage : virus qui infecte une bacterie. 

Centromere : region specialisee de l’ADN de chaque chromosome 
eucaryote maintenant ensemble les chromatides soeurs. C’est aussi le 
site de liaisons des proteines du kinetochore qui capturent ensuite les 
microtubules a partir des fuseaux mitotiques et meiotiques. 

Centrosome : organite organisateur de microtubules agissant comme 
pole du fuseau pendant la mitose. II contient souvent une paire de 
centrioles. 

Chromatide : copie d’un chromosome par replication de 1’ ADN jointe 
encore a l’autre copie par le centromere. 

Chromatine : complexe macromoleculaire du noyau d’une cellule 
eucaryote forme par l’ADN, les histones, certains ARN et d’autres 
proteines non-histones. Materiau constitutif des chromosomes. 

Chromosome : arrangement lineaire de genes et d’autres formes 
d’ADN, associe parfois avec certains ARN et proteines. 

Chiasma : structure en forme de croix observee entre des chromatides 
non-soeurs lors de la meiose. 

Clone : population de cellules ou d’organismes genetiquement iden- 
tiques, issus d’une meme cellule ou d’un meme ancetre. 
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Chromosome polytene : chromosome geant produit par un processus 
endomitotique au cours duquel de nombreux segments d’ADN restent 
lies. 

Cluster : region regroupant des genes ayant des fonctions similaires 
mais d’une structure differente en modifiant la regulation de leur 
expression, a la fois dans le temps et dans l’espace. 

Codominance : situation dans laquelle un heterozygote presente de 
maniere equivalente les effets phenotypiques des deux alleles. 

Coiffe : designe l’addition a l’extremite 5’ d’un ARN messager d’une 
methyl guanine phosphate, protegeant le dit ARN d’une degradation 
exonucleasique. 

Complementation : production d’un phenotype de type sauvage par 
deux mutations differentes combinees au sein d’une cellule diploide 
ou d’un heterocaryon. 

Conjugaison : union temporaire de deux organismes unicellulaires 
(bacteries, protistes,...) au cours de laquelle une cellule donneuse 
transfere du materiel genetique a une cellule receveuse. 

Croisement test : croisement d’un individu de genotype inconnu ou 
d’un heterozygote avec un individu de genotype double recessif pour 
le ou les caracteres etudies. 

Crossing-over : echange de fragments chromosomiques semblables 
entre des chromatides non sceurs homologues. 

Contigs : groupes ordonnes de clones chevauchants qui assembles, 
reconstituent une region chromosomique ou un genome. 

Cycle cellulaire : cycle de reproduction de la cellule oscillant entre la 
rnitose (M) et l’interphase (G l5 S et G 2 ) et constitue d’une sequence 
d’evenements par lesquels la cellule duplique son contenu avant de se 
diviser en deux cellules. 

Cytogenetique : approche cytologique de la genetique par une etude 
en microscopie des chromosomes. 

Diploide : cellule ou organisme qui possede deux jeux complets de 
chromosomes homologues (c’est-a-dire deux alleles pour chaque locus 
genetique). Les cellules somatiques possedent 2 n chromosomes. 

Division equationnelle : division qui maintient constant le nombre 
de chromosomes ou niveau de ploidie des cellules. 

Division reductionnelle : division nucleaire qui genere des noyaux-fils 
possedant chacun la moitie des chromosomes contenus dans le noyau 
parental. 
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Domaine activateur : region d’une proteine qui interagit directement 
avec le domaine carboxy-terminal de l’ARN polymerase et stimule 
ainsi la transcription. 

Dominance : designe l’effet d’un allele ou d’un gene qui impose le 
phenotype chez un heterozygote. S’oppose a recessivite. 

Double helice d’ADN : structure de l’ADN, composee de deux brins 
en forme d’helice entrelaces relies par des liaisons hydrogene par 
appariement des bases. 

Empreinte genetique : aussi appelee « Test ADN », est une technique 
pour identifier des individus de la meme espece en comparant de 
courte sequences de leur ADN. 

Empreinte parentale : phenomene epigenetique par lequel l’activite 
d’un gene chez un individu depend du parent qui l’a transmis. Certains 
genes ont done une empreinte maternelle et d’autres une empreinte 
paternelle. 

Enhancer : stimulateur, defini comme une sequence d’ADN qui, 
lorsqu’elle est liee par une proteine dite activatrice, facilite l’expression 
d’un gene en fonction du tissu considere. II est parfois tres eloigne en 
amont ou en aval du gene cible. 

Epissage : reaction complexe consistant en T eli mi nation des introns 
et en l’assemblage des exons constitutifs d’un transcrit primaire d’un 
gene. 

Epissage alternatif : processus par lequel a partir d’un meme transcrit 
primaire des ARN messagers differents sont produits a la suite de 
variations dans le patron d’epissage du pre-ARNm. 

Epistasie : situation dans laquelle l’expression phenotypique diffe- 
rentielle d’un genotype a un locus depend du genotype a un autre locus. 

Exon : toute section non intronique de la sequence codante d’un gene. 
Lorsqu’ils sont assembles apres T epissage du transcrit primaire les 
exons constituent l’ARN messager qui est traduit en proteine. 

Episome : element genetique qui peut se repliquer de fag on indepen- 
dante dans le cytoplasme de la bacterie. II peut egalement integrer le 
chromosome bacterien et se repliquer alors en meme temps que lui. 

Facteur F : episome bacterien qui confere a la cellule qui le possede 
la propriete de transmettre du materiel genetique. 

Frequence allelique : mesure de la presence d’un allele dans une 
population par rapport a tous les alleles d’un gene, presents dans la 
meme population. 
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Frequence genotypique : proportion d’individus ayant un genotype 
donne au sein d’une population. 

Genome : ensemble du materiel genetique contenu dans le ou les 
chromosomes d’une cellule. 

Genotype : composition allelique specifique d’une cellule pour un 
gene, un groupe de genes voire la totalite de son genome. 

Haploide : cellule ou organisme ne possedant qu’un seul jeu de 
chromosome. 

Frequence de recombinants : pourcentage ou proportions d’individus 
ou de cellules recombinants dont le phenotype differe des phenotypes 
parentaux de depart. 

Generation FI : premiere generation de descendants produite par le 
croisement de deux lignees parentales. 

Generation F2 : deuxieme generation de descendants issue d’un 
croisement entre individus d’une meme FI ou par autofecondation 
chez les vegetaux. 

Haplotype : classe genetique decrite par une sequence d’ ADN (combi- 
naison de SNPs) ou de genes presents sur un chromosome (combinaison 
des alleles). 

Heredite : ressemblance des caracteres entre parents et descendants. 

Heritabilite : proportion de la variance phenotypique dans une 
population attribuable a la variance genotypique. 

Heterozygote : organisme possedant pour un meme gene deux alleles 
differents. 

Histone : proteine basique constituant des complexes octameriques 
(2 exemplaires de chacune des histones H2A, H2B, H3 et H4) autour 
desquels 1’ ADN est enroule pour former les nucleosomes des chromo- 
somes eucaryotes. L’histone HI participe a la cohesion de l’ensemble. 

Homeoboite : courte sequence d’ADN d’environ 180 pb, situee au sein 
d'un gene implique dans la regulation du developpement des animaux, 
champignons et plantes. Ces genes sont nommes pour cette raison 
« genes a homeoboites » et ferment la famille des genes homeotiques. 

Homeodomaine : domaine proteique d’environ 60 acides amines, 
present dans la sequence peptidique de l’homeoboite et capable de se 
lier a l’ADN. 

Homozygote : organisme possedant pour un meme gene deux alleles 
identiques. 
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Inducteur : molecule ou plus generalement agent de l’environnement 
qui stimule la transcription de l’ADN a partir d’un promoteur. 

Interference : mesure dans une region chromosomique de l’indepen- 
dance des crossing-over les uns des autres. 

Intron : region non codante d’un gene eucaryote, situee entre deux 
exons, transcrite en ARN mais ensuite excisee par epissage et absente 
de l’ARN messager mature traduit en proteine. 

IRES : « internal ribosome entry site », sequences internes particulieres 
des ARN messagers eucaryotes et des ARN viraux eucaryotes fonction- 
nant comme des sites d’entree des ribosomes a l’instar des sites de 
liaison RBS situes a l’extremite 5’ de l’ARN messager procaryote. 

Isolateur : nom donne a une sequence regulatrice au sein de l’ADN 
separant les stimulateurs (enhancers) de certains promoteurs. Lorsqu’il 
est occupe par une proteine appropriee 1' isolateur bloque la communi- 
cation entre les proteines activatrices liees aux stimulateurs et certains 
promoteurs. 

Jonction de Holliday : structure intermediaire dans la recombinaison 
genetique impliquant deux molecules d’ADN double brin, reliees par 
1’ intermediaire d’un crossing-over reciproque interessant un brin de 
chaque molecule. 

Kinetochore : complexe de proteines auxquelles s’ attache les micro- 
tubules constituant les fibres du fuseau mitotique nucleaire jouant un 
role actif dans le mouvement des chromosomes vers les poles. 

Liaison a l’X : mode de transmission des genes presents dans la 
region differentielle du chromosome X et absents du chromosome Y. 

LINE : appeles longs elements nucleates disperses, ils correspondent 
a des elements transposables de classe 1 codant une transcriptase 
inverse. 

Lysogenie : un des deux types de developpement s’appliquant a une 
bacterie infectee par un phage tempere. Dans ce mode, le genome du 
phage est reprime. II s’integre dans le genome bacterien et se replique 
comme ce dernier. Sous l’effet d’une induction environnementale 
mettant en cause la survie de la bacterie-hote, la derepression du genome 
viral se produit et le mode de developpement lytique s’installe entrainant 
la production de nouvelles particules virales et leur liberation dans 
l’environnement par la lyse de la bacterie. 

Meiose : deux divisions successives qui produisent les gametes chez 
les animaux et les spores chez les champignons et vegetaux. Les 
4 cellules qui en resultent, possedent la moitie du materiel genetique 
de la cellule d’origine. 
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Microsatellite : nom donne a de courtes sequences d’ ADN constitutes 
par la repetition en nombre variable selon les individus de di- ou 
trinucleotides. Exemple : la repetition de nucleotides contenant thymine 
et guanine, (TG) n . 

Microtubule : tubules fins et creux assembles a partir de sous-unites 
de la tubuline. Ils fonnent le plus important des trois systemes de cablage 
filamenteux du cytosquelette. 

Morphogene : molecule qui intervient directement par son activite et 
en fonction de sa concentration dans la morphogenese d’un organisme. 

Multiallelisme : traduit un nombre eleve d’ alleles differents pour un 
meme gene dans une population donnee. 

Mutation ponctuelle : modification hereditaire de la sequence nucleo- 
tidique d’un chromosome portant sur une seule base purique (A, G) 
ou pyrimidique (T, C). 11 peut s’agir d’une transversion (Pu <=> Py) ou 
d’une transition (Pu Pu ou Py <=> Py). 

Nucleosome : unite de base de la structure d’un chromosome eucaryote 
(voir histone). 

Octade : asque contenant huit ascospores, produit chez des especes 
dont la tetrade subit une division mitotique apres la meiose. 

Octamere : complexe moleculaire compose de 8 sous-unites ou mono- 
meres. Le noyau proteique d’un nucleosome se compose d’un octamere 
d'histones. 

Operateur : designe une region de 1’ ADN situe au debut d’un ensemble 
de genes adjacents transcrits simultanement (operon). L’ operateur est 
le site de liaison d’une proteine dite represseur de l’operon. 

Organisme transgenique : organisme dont le genome a ete modifie 
par 1’ introduction d’un ADN etranger porteur de nouveaux genes. 

Origine de replication : sequence nucleotidique ou site de l’ADN ou 
demarre la replication. 

Paramutation : designe l’effet d’un des deux alleles presents a une 
generation et qui affecte de faqon heritable 1’ autre allele dans les gene- 
rations ulterieures, meme si l’allele responsable du changement n’est 
pas lui-meme transmis. 

Phenotype : forme adoptee par un caractere, liee a un genotype 
specifique. 

Pili : ou pilus, appendice porte par une bacterie E. coli donneuse et 
servant de pont pour la transmission d’ADN a une bacterie receveuse 
lors de la conjugaison. 
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Plasmide : petite molecule d’ADN circulaire extrachromosomique se 
repliquant de fa?on autonome. Considere comme un outil essentiel de 
l’ingenierie genetique. 

Ploidie : nombre de jeux de chromosomes presents dans une cellule 
ou un organisme. 

Pre-ARNm : molecule d’ARN dite precurseur de l’ARN messager. 
Designe le transcrit primaire d’un gene avant les diverses modifications 
(epissage des introns, eventuel « editing », polyadenylation) conduisant 
a la formation de l’ARN messager mature, devenu apte pour la 
traduction en proteine. 

Procaryote : organisme constitue d’une seule cellule sans noyau, le 
materiel genetique etant dans le cytoplasme. 

Promoteur : sequence d’ADN en amont de l’extremite 5’ de la sequence 
d’un gene, constituant le site de liaison des ARN polymerases assurant 
le demarrage de la transcription. 

Prophage : chromosome phagique insere au sein de l’ADN d’un 
chromosome bacterien. 

Proteine cro : une des principals proteines regulatrices impliquees 
dans le mode lytique de l’infection d’une bacterie par le phage X (voir 
mode lysogene et mode lytique). 

Recessivite : ce terme s’emploie pour designer un allele, present chez 
un heterozygote, qui ne peut donner un phenotype lorsqu’il est seul ; 
le phenotype etant impose par 1’ allele dominant. 

Recombinaison : terme general designant tout processus cellulaire 
qui engendre une nouvelle combinaison genique ou chromosomique 
non preexistante dans la cellule en question ou dans ses progeniteurs. 
Designe aussi le processus similaire qui se produit a la meiose au 
cours de la formation d’un produit haploide different des haploides 
constituant le diploide meiotique initial. 

Recombinaison homologue : recombinaison entre deux molecules 
d’ADN de sequences similaires, frequente au cours de la meiose et de 
la mitose chez les eucaryotes. 

Recombinaison interchromosomique : recombinaison resultant d’un 
assortment independant des chromosomes a la l re division meiotique. 

Recombinaison intrachromosomique : recombinaison resultant d’un 
crossing-over entre deux loci portes par des chromosomes homologues. 

Represseur : designe la proteine qui se lie a une sequence regulatrice 
de l’ADN ou sur l’operateur d’un gene et qui bloque la transcription. 
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Represseur A : designe le represseur specifique du phage A, qui bloque 
la transcription des genes du mode lytique et oriente le processus 
infectieux du phage A vers le mode lysogene marque par 1’ integration 
du genome viral dans le chromosome bacterien sous la forme du 
prophage. 

Shotgun : methode qui consiste a fragmenter en morceaux de tres 
petite taille l’ADN chromosomique, a cloner les fragments puis a les 
sequencer directement. 

Silencer : extincteur, defini comme une sequence d’ADN qui, lorsqu’elle 
est liee par une proteine inhibitrice (represseur), bloque l’expression 
d’un gene en fonction du tissu considere. Cette sequence est parfois 
tres eloignee en amont ou en aval du gene cible. 

SINE : ou courts elements nucleaires disperses, correspondent a des 
elements transposables de classe 1 mais ne codent pas une transcriptase 
inverse, utilise celle des LINE. 

Site d’epissage : sequences aux extremites 5’ et 3’ d’un intron grace 
auxquelles s’effectue l’epissage de l’intron. 

Spliceosome : complexe ribonucleoproteique de grande taille implique 
dans le processus d’epissage (« splicing ») des transcrits primaires 
d’ARN. 

Stimulateur : ou activateur ou « enhancer », sequences d’ADN, sites 
de liaison de facteurs de transcription agissant positivement sur la 
transcription des genes souvent proches de ces sequences. 

Suppresseur : mutation qui peut faire disparaitre l’effet d’une mutation 
sur un autre gene et restituer le phenotype sauvage. 

Telomerase : enzyme qui utilise comme matrice une petite sequence 
d’ARN pour catalyser l’addition d’unites nucleotidiques repetees aux 
extremites des chromosomes lineaires eucaryotes afin de compenser 
leur raccourcissement consecutif a la replication. 

Telomere : sequence particuliere situee a l’extremite d’un chromo- 
some lineaire eucaryote. 

Topoisomerase : enzyme qui introduit des surenroulements positifs ou 
negatifs dans un duplex circulaire ferine. Elle clive les polynucleotides 
des duplex surenroules afin de relacher les contraintes puis reconstitue 
la liaison phosphodiester. 

Traduction : processus au cours duquel l’information genetique 
contenue dans une molecule d’ARN messager determine la sequence 
des acides amines lors de la synthese proteique. 
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Transcription : processus enzymatique au cours duquel l’information 
genetique contenue dans une molecule d’ADN simple brin determine 
par complementarity des bases la sequence en nucleotides d’une chaine 
d'ARN. 

Transcrit primaire : ARN initial resultant du processus de la trans- 
cription (voir pre-ARNm). 

Transduction : transfert de gene d’une bacterie a une autre par 
1’ intermediate d’un phage. 

Transduction generalisee : capacite de certains phages a transduire 
n'importe quel gene dans le chromosome bacterien. 

Transduction specialise : capacite pour un phage specifique de trans- 
duire que des regions particulieres d’un chromosome bacterien. 

Transformation : modification dirigee d’un genome par introduction 
dans la cellule-hote d’un ADN exogene ce qui donne a la cellule un 
nouveau phenotype. 

Transition : designe les mutations ponctuelles substituant entre elles 
les bases puriques ou les bases pyrimidiques (voir mutation ponctuelle). 

Transposition : ensemble des mecanismes moleculaires assurant la 
mobilite d’un gene ou d’un ensemble de genes d’un site du genome a 
un autre. 

Transversion : designe les mutations ponctuelles substituant les bases 
puriques et pyrimidiques entre elles (voir mutation ponctuelle) 

Zygote : cellule formee par la fusion d’un gamete male (spermatozoide) 
et d’un gamete femelle (ovule). Le diploide forme se divisera pour 
creer un organisme diploide differencie. 
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diplo'ide 74, 92 
division 
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differentielle 191 
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S 

S 72 
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codante 138 
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telophase 169 
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